Diferença nos valores de p reportados entre lm e aov em R


12

O que explica as diferenças nos valores de p no seguinte aove nas lmchamadas? A diferença é apenas devido a diferentes tipos de cálculos de somas de quadrados?

set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
summary(lm(data~f1*f2))$coeff

Respostas:


13

summary(aov)usa somas de quadrados do tipo I (seqüenciais). summary(lm)usa somas de quadrados do Tipo III, que não são seqüenciais. Veja a resposta do gung para detalhes.


lm(data ~ factor(f1) * factor(2))aov()t

t=ψ^ψ0σ^c(XX)1c

c(XX)1cβcF


1
Eu acho que a primeira frase desta resposta está errada. A diferença parece ser precisamente devida a diferentes tipos de soma de quadrados: tipo I vs. tipo II / III. O tipo I é seqüencial, que é o que lminforma, enquanto o tipo II / III não. Isso é explicado com bastante detalhes na resposta do @ gung à qual você vinculou.
Ameba diz Reinstate Monica

@amoeba O que você sugere para corrigir a resposta?
Caracal

Editei o primeiro parágrafo, veja se você concorda com a edição e sinta-se à vontade para alterá-la como quiser.
Ameba diz Reinstate Monica

2
set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
            Df Sum Sq Mean Sq F value Pr(>F)
f1           1  0.535  0.5347   0.597  0.462
f2           1  0.002  0.0018   0.002  0.966
f1:f2        1  0.121  0.1208   0.135  0.723
Residuals    8  7.169  0.8962               
summary(lm(data~f1*f2))$coeff
               Estimate Std. Error    t value  Pr(>|t|)
(Intercept)  0.05222024   2.732756  0.0191090 0.9852221
f1          -0.17992329   1.728346 -0.1041014 0.9196514
f2          -0.62637109   1.728346 -0.3624106 0.7264325
f1:f2        0.40139439   1.093102  0.3672066 0.7229887

Estes são dois códigos diferentes. do modelo Lm, você precisa dos coeficientes. enquanto no modelo aov você está apenas tabulando as fontes de variação. Experimente o código

anova(lm(data~f1*f2))
Analysis of Variance Table

Response: data
          Df Sum Sq Mean Sq F value Pr(>F)
f1         1 0.5347 0.53468  0.5966 0.4621
f2         1 0.0018 0.00177  0.0020 0.9657
f1:f2      1 0.1208 0.12084  0.1348 0.7230
Residuals  8 7.1692 0.89615   

Isso fornece a tabulação das fontes de variação, levando aos mesmos resultados.


2
Isso não parece responder à pergunta, que pergunta por que os valores-p f1e f2diferem nos dois resumos do seu painel superior. Parece que você está mostrando apenas que summary(aov(...))e anova(lm(...))em Rter uma saída similar.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.