A página da Wikipedia na ANOVA lista três suposições , a saber:
- Independência de casos - esta é uma suposição do modelo que simplifica a análise estatística.
- Normalidade - as distribuições dos resíduos são normais.
- Igualdade (ou "homogeneidade") de variações, chamada homoscedasticidade ...
O ponto de interesse aqui é a segunda suposição. Várias fontes listam a suposição de maneira diferente. Alguns dizem que a normalidade dos dados brutos, alguns alegam resíduos.
Surgem várias perguntas:
- a normalidade e a distribuição normal de resíduos são a mesma pessoa (com base na entrada da Wikipedia, eu diria que a normalidade é uma propriedade e não pertence diretamente a resíduos (mas pode ser uma propriedade de resíduos (texto profundamente aninhado entre colchetes, esquisito)))?
- se não, qual suposição deve ser mantida? 1? Ambos?
- se a suposição de resíduos normalmente distribuídos é a correta, estamos cometendo um erro grave verificando apenas o histograma dos valores brutos quanto à normalidade?