Existe um limite que seja menos aceitável ao usar a imputação múltipla (MI)?
Por exemplo, posso usar o MI se os valores ausentes em uma variável forem 20% dos casos, enquanto outras variáveis tiverem valores ausentes, mas não a um nível tão alto?
Existe um limite que seja menos aceitável ao usar a imputação múltipla (MI)?
Por exemplo, posso usar o MI se os valores ausentes em uma variável forem 20% dos casos, enquanto outras variáveis tiverem valores ausentes, mas não a um nível tão alto?
Respostas:
A partir dos comentários, você está confiante de que está em uma situação de MAR ou MCAR. Então a imputação múltipla é pelo menos razoável. Então, quanta falta é tratável? Pense desta maneira:
Basicamente, a imputação múltipla faz com que todas as estimativas de parâmetros do modelo sejam menos certas em função da precisão com que os dados ausentes podem ser previstos com o modelo de imputação, o que dependerá, entre outras coisas, da quantidade de falta que precisa ser imputada e a número de imputações que você usa.
Quanto é falta em excesso, portanto, depende da quantidade de variação / incerteza que você está disposto a suportar. Uma quantidade útil para você pode ser a eficiência relativa () de uma análise de MI. Isso depende da 'fração de informações ausentes' (não da simples taxa de falta), geralmente chamadae o número de imputações, geralmente chamado , Como .
Em vez de gerar as definições de informações ausentes etc. aqui, você pode simplesmente ler as Perguntas frequentes sobre MI, que colocam as coisas com muita clareza. A partir daí, você saberá se deseja abordar as fontes originais: Rubin etc.
Na prática, você provavelmente deveria apenas tentar uma análise de imputação e ver como ela funciona.
Você pode encontrar
Rubin, Donald B. e Nathaniel Schenker. 1986. "Imputação Múltipla para Estimação de Intervalo de Amostras Aleatórias Simples com Não Resposta Ignorável". Jornal da Associação Estatística Americana 81 (394): 366-374.
útil.