Antes de fazer essa pergunta, pesquisei em nosso site e encontrei muitas perguntas semelhantes (como aqui , aqui e aqui ). Mas acho que essas perguntas relacionadas não foram bem respondidas ou discutidas, portanto, gostaria de levantar essa questão novamente. Eu acho que deve haver uma grande quantidade de audiência que deseja que esse tipo de pergunta seja explicado mais claramente.
Para minhas perguntas, primeiro considere o modelo linear de efeitos mistos,
Vamos supor que o único fator de efeito fixo seja uma variável categórica Tratamento , com 3 níveis diferentes. E o único fator de efeito aleatório é a variável Assunto . Dito isto, temos um modelo de efeito misto com efeito de tratamento fixo e efeito de sujeito aleatório.
Minhas perguntas são assim são:
- Existe a suposição de homogeneidade de variância na configuração linear de modelos mistos, análoga aos modelos tradicionais de regressão linear? Se sim, o que a suposição significa especificamente no contexto do problema do modelo misto linear declarado acima? Quais são outras suposições importantes que precisam ser avaliadas?
Meus pensamentos: SIM. as suposições (quero dizer, zero erro médio e igual variação) ainda são daqui: . Na configuração tradicional do modelo de regressão linear, podemos dizer que a suposição é que "a variação dos erros (ou apenas a variação da variável dependente) é constante nos três níveis de tratamento". Mas estou perdido como podemos explicar essa suposição sob a configuração do modelo misto. Devemos dizer "as variações são constantes em três níveis de tratamentos, condicionando os sujeitos? Ou não?"
O documento on-line do SAS sobre os resíduos e o diagnóstico de influência trouxe dois resíduos diferentes, ou seja, os resíduos marginais , e os resíduos condicionais , Minha pergunta é: para que servem os dois resíduos? Como poderíamos usá-los para verificar a suposição de homogeneidade? Para mim, apenas os resíduos marginais podem ser usados para resolver a questão da homogeneidade, pois corresponde ao do modelo. Meu entendimento aqui está correto?
Existem testes propostos para testar a premissa de homogeneidade no modelo misto linear? @Kam apontou o teste do levene anteriormente, seria esse o caminho certo? Caso contrário, quais são as instruções? Acho que depois que ajustamos o modelo misto, podemos obter os resíduos e talvez fazer alguns testes (como o teste de qualidade do ajuste?), Mas não tenho certeza de como seria.
Também notei que existem três tipos de resíduos do Proc Mixed no SAS, a saber, o resíduo bruto , o residual estudantilizado e o residual de Pearson . Eu posso entender as diferenças entre eles em termos de fórmulas. Mas para mim eles parecem muito semelhantes quando se trata de gráficos de dados reais. Então, como eles devem ser usados na prática? Existem situações em que um tipo é preferido em relação aos outros?
Para um exemplo de dados reais, os dois gráficos residuais a seguir são do Proc Mixed no SAS. Como a suposição da homogeneidade das variações pode ser tratada por eles?
[Eu sei que tenho algumas perguntas aqui. Se você pudesse me fornecer algum de seus pensamentos para qualquer pergunta, isso é ótimo. Não há necessidade de abordar todos eles, se você não puder. Eu realmente gostaria de discutir sobre eles para obter uma compreensão completa. Obrigado!]
Aqui estão os gráficos residuais marginais (brutos).
Aqui estão os gráficos residuais condicionais (brutos).