Traçando uma "superfície mediana posterior"

Como parte da reprodução de um modelo que descrevi parcialmente nesta questão no Stack Overflow, quero obter um gráfico de uma distribuição posterior. O modelo (espacial) descreve o preço de venda de algumas propriedades como uma distribuição de Bernoulli, dependendo de a propriedade ser cara (1) ou barata (0). Nas equações:

y_{Eu} \sim Bernoulli (p_{Eu})

$y_{i} \sim \text{Bernoulli}(p_{i})$

p_{Eu} \sim {logit}^{- 1} (b_{0 0} + b_{1} Sala-de-estar / 1000 + b_{2} Era + W (s))

$p_{i} \sim \text{logit}^{-1}(b_{0} + b_{1}\text{LivingArea}/1000 + b_{2}\text{Age} + w({\bf{s}}))$

W (s) \sim MVN (0 0, Σ)

$w({\bf{s}}) \sim \text{MVN}({\bf{0}}, {\bf{\Sigma}})$

onde é o resultado binário 1 ou 0, é a probabilidade de ser barato ou caro, é uma variável aleatória espacial em que representa sua posição . Tudo isso para cada porque existem 70 propriedades no conjunto de dados. é uma matriz de covariância baseada na posição geográfica dos pontos de dados. Se você estiver curioso sobre esse modelo, o conjunto de dados pode ser encontrado aqui . $y_{i}$ $p_{i}$ $w({\bf{s}})$ $\bf{s}$ $i = \{1, ..., 70\}$ $\bf{\Sigma}$

A plotagem que desejo obter é a seguinte plotagem de contorno:

insira a descrição da imagem aqui

A figura é descrita como "Gráfico da imagem da superfície mediana posterior do processo latente , modelo espacial binário". O livro também diz o seguinte: $w({\bf{s}})$

A Figura 5.8 mostra o gráfico da imagem com linhas de contorno sobrepostas para a superfície média posterior do processo latente . $w({\bf{s}})$

No entanto, existem apenas 70 pares de pontos no conjunto de dados. Suponho que, para produzir um gráfico de contorno, preciso estimar em 70 * 70 pontos. Então, minha pergunta é: como produzo essa superfície mediana posterior? Até agora, tenho amostras de distribuições posteriores para todos os parâmetros envolvidos (usando PyMC) e sei que posso prever em um novo ponto usando a distribuição preditiva posterior. No entanto, não sei como prever valores em um novo ponto . Talvez eu esteja errado e o enredo não tenha sido construído por previsão, mas por interpolação. $w({\bf{s}})$ $y^*$ $w({\bf{s}})$ $s^*$

ATUALIZAÇÃO :

Primeiro, esta é a mediana da distribuição posterior de em cada local onde há uma propriedade. Isso é baseado no rastreio do MCMC para . $w({\bf{s}})$ $w$

insira a descrição da imagem aqui

E esta é a interpolação (com um gráfico de contorno) usando uma função de base radial:

insira a descrição da imagem aqui

(Se você estiver interessado no código, me avise)

Como você pode ver, existem diferenças significativas nas parcelas. Algumas perguntas:

Como posso saber se essas diferenças são explicadas pelo procedimento de interpolação?
Talvez haja variações importantes na distribuição posterior de que calculei e a mostrada no livro. Quanta variação é aceitável entre as simulações do MCMC? Até meus próprios parâmetros mudam um pouco, dependendo da amostra que eu uso (Metropolis, Metropolis Adaptive.) $w({\bf{s}})$
Existe algum procedimento bayesiano para prever pontos , a fim de gerar um gráfico de contorno, como fiz usando a função de base radial? $w(s)$

— Robert Smith
fonte

Interpolação é previsão! (Como é um processo, apresentar um valor de em qualquer local não observado equivale a adivinhar o valor de uma variável aleatória. Previsão, por definição, adivinha o valor de uma variável aleatória.)

w

$w$

w

$w$

— whuber

Certo. Eu quis dizer interpolação em oposição à previsão bayesiana. A propósito, tentei usar a interpolação com o vizinho mais próximo e obtive resultados terríveis.

— Robert Smith

w

$w$

y_{i}

$y_i$

w (s)

$w(s)$

s

$s$

w (s)

$w(s)$

É muito provável que o autor tenha utilizado um processo gaussiano para produzir a interpolação. Eu acho que isso é verdade porque um exercício do livro descreve um problema muito semelhante a este e requer uma trama baseada em um processo gaussiano.

$w(s)$

insira a descrição da imagem aqui

E esta é a interpolação baseada em um processo gaussiano:

insira a descrição da imagem aqui

Como você pode ver, o método de interpolação faz uma enorme diferença.

— Robert Smith
fonte