Atualmente, estou executando um modelo de regressão múltipla usando dados imputados e tenho algumas perguntas.
Fundo:
Usando o SPSS 18. Meus dados parecem ser MAR. A exclusão listwise de casos me deixa com apenas 92 casos, a imputação múltipla deixa 153 casos para análise. Todas as premissas atendidas - um log variável transformado. 9 IV's 5 - 5 categóricos, 3 escalas, 1 intervalo. Escala DV. Usando o método enter da regressão múltipla padrão.
- Meu DV é a diferença de pontuação entre uma medida de pré-pontuação e pós-pontuação, essas duas variáveis estão faltando vários casos - devo atribuir valores ausentes para cada uma delas e depois calcular a diferença entre elas para calcular minha DV (como faço para fazer isso) ou posso apenas imputar dados para o meu DV? Qual é a abordagem mais apropriada?
- Devo executar imputações em dados transformados ou dados não transformados distorcidos?
- Devo inserir todas as variáveis no processo de imputação, mesmo que não estejam faltando dados, ou devo apenas imputar dados para as variáveis que faltam em mais de 10% dos casos?
Eu executei a regressão nos casos excluídos listwise e os meus IVs representam muito pouca variação no meu DV; posteriormente, executei a regressão em um arquivo completo após imputação múltipla - Os resultados são muito semelhantes, pois meus 9IVs ainda prever apenas aproximadamente 12% da variação no meu DV, no entanto, agora um dos meus IV'S indica que está fazendo uma contribuição significativa (essa é uma variável transformada em log) ...
- Devo relatar dados originais se houver pouca diferença entre minhas conclusões - ou seja, meus IVs mal prevêem o dv ou relatam os dados completos?
R^2
ocorra uma baixa ). Veja aqui uma boa discussão sobre designs pré-pós . Embora isso ainda não responda totalmente à sua pergunta!