Valores ausentes na variável de resposta no JAGS


10

Gelman e Hill (2006) dizem:

No Bugs, os resultados ausentes em uma regressão podem ser manipulados facilmente, simplesmente incluindo o vetor de dados, NAs e tudo. Os bugs modelam explicitamente a variável de resultado e, portanto, é trivial usar esse modelo para, de fato, atribuir valores ausentes a cada iteração.

Parece uma maneira fácil de usar o JAGS para fazer previsões. Mas as observações com os resultados ausentes também afetam as estimativas de parâmetros? Em caso afirmativo, existe uma maneira fácil de manter essas observações no conjunto de dados que o JAGS vê, mas não para que elas afetem as estimativas de parâmetros? Eu estava pensando sobre a função de corte, mas isso só está disponível no BUGS, não no JAGS.

Respostas:


11

Sim, é realmente fácil de usar em BUGS ou JAGS! É realmente um prazer usá-lo!

Mas as observações com os resultados ausentes também afetam as estimativas de parâmetros?

Claro que não. Os parâmetros são afetados apenas pelos resultados observados. Os resultados perdidos (NAs) não afetarão nada, na verdade é o contrário: os resultados perdidos serão derivados dos parâmetros. Observe que os resultados ausentes também terão sua distribuição posterior. Então é muito fácil calcular algumas quantidades derivadas, por exemplo, uma soma sobre os índices do resultado, e essas quantidades derivadas não apenas são tratadas para valores ausentes, mas também têm sua distribuição posterior imediatamente. É isso que é tão sexy em BUGS & JAGS!

Diverta-se!


11
Desculpe, não estou convencido de que os resultados ausentes não afetem as estimativas de parâmetros. Jackman parece dizer o oposto: jackman.stanford.edu/blog/?p=38
Jack Tanner

@ JackTanner, pense um pouco. Como o valor ausente pode afetar alguma coisa? À medida que o algoritmo inicia, o valor ausente começará a ser imputado a partir das estimativas dos parâmetros (elas são derivadas dos resultados observados). Então (talvez não tenha certeza), as informações do resultado ausente imputado podem retornar aos parâmetros, mas isso não importa - são apenas as informações originais, presentes nos parâmetros, retornadas a eles. A informação REAL que afeta algo é proveniente apenas dos resultados reais. Se você não confia em mim, faça uma simulação, compare os resultados e poste aqui.
curioso

Em relação ao seu link, ele aparentemente não tem certeza, diz "problema" - entre aspas e diz "seria interessante compará-lo". Eu digo que não haverá diferença significativa. Se você quiser testá-lo, vá em frente.
curioso

3
Concordo; nenhuma diferença significativa. Eu uso essa abordagem para construir distribuições preditivas posteriores; basta colocar os valores preditivos das variáveis ​​do lado direito juntamente com os valores anteriores e os NAs para a variável de destino "observações" correspondentes aos valores preditivos.
jbowman

@bowman, sim, boa nota! Não é uma idéia óbvia fazer previsões dessa maneira!
curioso
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.