Eu tenho um problema em que
Eu observo y, mas nem nem . Eu quero estimarb
Eu posso estimar , usando algum tipo de modelo de regressão. Isso me dá . Eu poderia então estimarb
Primeiro problema: um modelo de regressão para prever poderia levar a ser negativo, o que não faria sentido. Não tenho certeza de como contornar isso (não é o tipo de problema com o qual eu lidei muito), mas parece ser o tipo de coisa com a qual outras pessoas lidam rotineiramente. Algum tipo de GLM não gaussiano?b
O principal problema é como explicar a incerteza no modelo principal resultante da estimativa de . Eu usei várias imputações antes para covariáveis ausentes. Mas este é um "parâmetro latente" ausente. Como alternativa, são dados de resultados, que parecem adequados para imputar . No entanto, ouço frequentemente o EM usado para parâmetros "latentes". Não sei por que, nem sei se o EM é melhor nesses contextos. O MI é intuitivo para entender, implementar e se comunicar. O EM é intuitivo de entender, mas parece mais difícil de implementar (e ainda não o fiz).
O EM é superior para o tipo de problema que tenho acima? Se sim, por quê? Segundo, como implementá-lo em R para um modelo linear ou para um modelo semiparamétrico (GAM)?