Se você estiver executando a ANOVA unidirecional para testar se há uma diferença significativa entre os grupos, estará implicitamente comparando dois modelos aninhados (portanto, existe apenas um nível de aninhamento, mas ele ainda está aninhado).
Esses dois modelos são:
- yeu jEujβ^0 0
yeu j= β^0 0+ ϵEu
Modelo 1: Os valores são modelados pelas médias estimadas dos grupos.
βj^
yEu= β^0 0+ β^j+ ϵEu
Um exemplo de comparação de médias e equivalência a modelos aninhados: vamos pegar o comprimento da sépala (cm) do conjunto de dados da íris (se usarmos todas as quatro variáveis, poderíamos realmente fazer LDA ou MANOVA como Fisher fez em 1936)
As médias totais e de grupo observadas são:
μt o t a lμs e t o s umμv e r s i c o l o rμv i r gi n i c uma= 5,83= 5,01= 5,94= 6,59
Qual é o formato do modelo:
modelo 1: modelo 2: yeu j= 5,83 + ϵEuyeu j= 5,01 + ⎡⎣⎢0 00,931,58⎤⎦⎥j+ ϵEu
∑ ϵ2Eu= 102.1683
∑ ϵ2Eu= 38,9562
E a tabela ANOVA será como (e calcule implicitamente a diferença que é a soma dos quadrados entre os grupos, que é a 63.212 na tabela com 2 graus de liberdade):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F= R SSdeu ffe r e n c eD Fdeu ffe r e n c eR SSn e wD Fn e w= 63.212238.956147= 119,26
conjunto de dados usado no exemplo:
comprimento da pétala (cm) para três espécies diferentes de flores de íris
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
função, porque a primeira ANOVA real também está usando um teste-F. Isso leva à confusão da terminologia.