Estou confuso sobre a suposição de normalidade em medidas repetidas ANOVA. Especificamente, estou me perguntando que tipo de normalidade exatamente deve ser satisfeita. Ao ler a literatura e as respostas no currículo, encontrei três formulações distintas dessa suposição.
A variável dependente dentro de cada condição (repetida) deve ser distribuída normalmente.
Afirma-se frequentemente que o rANOVA possui as mesmas suposições que a ANOVA, mais a esfericidade. Essa é a alegação de de Campo estatísticas Descoberta , bem como na da Wikipedia artigo sobre o assunto e texto de Lowry .
Os resíduos (diferenças entre todos os pares possíveis?) Devem ser distribuídos normalmente.
Eu encontrei essa afirmação em várias respostas no CV ( 1 , 2 ). Por analogia do rANOVA ao teste t emparelhado , isso também pode parecer intuitivo.
A normalidade multivariada deve ser satisfeita.
A Wikipedia e essa fonte mencionam isso. Além disso, eu sei que o rANOVA pode ser trocado por MANOVA, o que pode merecer essa afirmação.
São equivalentes de alguma forma? Eu sei que normalidade multivariada significa que qualquer combinação linear dos DVs é normalmente distribuída; portanto, 3. incluiria naturalmente 2. se eu entendi o último corretamente.
Se estes não são os mesmos, qual é a suposição "verdadeira" do rANOVA? Você pode fornecer uma referência?
Parece-me que há mais suporte para a primeira reivindicação. Isso não está alinhado, no entanto, com as respostas geralmente fornecidas aqui.
Modelos mistos lineares
Devido à dica de @ utobi, agora entendo como o rANOVA pode ser reapresentado como um modelo misto linear. Especificamente, para modelar como alterações na pressão arterial com o tempo, eu modelar o valor esperado como: onde y i j são medições de pressão sanguínea, um i o sangue médio pressão do i sujeito -ésima, e t i j como o j tempo -ésimo o i sujeito -ésimo foi medido, b i
Finalmente, tentei pensar no que isso significa para a normalidade, mas com pouco sucesso. Parafraseando McCulloch e Searle (2001, p. 35. Eq. (2.14)):
Eu entendo que isso significa que
4. os dados de cada indivíduo precisam ser normalmente distribuídos, mas isso não é razoável para testar com poucos pontos no tempo.
Entendo a terceira expressão para dizer que
5. as médias de assuntos individuais são normalmente distribuídas. Observe que essas são outras duas possibilidades distintas além das três mencionadas acima.
McCulloch, CE e Searle, SR (2001). Modelos generalizados, lineares e mistos . Nova York: John Wiley & Sons, Inc.