Minha pergunta principal é como interpretar a saída (coeficientes, F, P) ao realizar uma ANOVA tipo I (seqüencial)?
Meu problema de pesquisa específico é um pouco mais complexo, então vou dividir meu exemplo em partes. Primeiro, se estou interessado no efeito da densidade da aranha (X1) no crescimento das plantas (Y1) e plantei mudas em cercos e manipulei a densidade da aranha, então posso analisar os dados com uma ANOVA simples ou regressão linear. Então, não importa se eu usei Soma dos Quadrados Tipo I, II ou III (SS) na minha ANOVA. No meu caso, tenho 4 réplicas de 5 níveis de densidade, para que eu possa usar a densidade como um fator ou como uma variável contínua. Nesse caso, prefiro interpretá-lo como uma variável independente contínua (preditora). No RI pode executar o seguinte:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
A execução da função anova fará sentido para comparação posteriormente, espero, portanto, ignore a estranheza dela aqui. A saída é:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Agora, digamos que eu suspeito que o nível inicial de nitrogênio inorgânico no solo, que eu não conseguia controlar, também tenha afetado significativamente o crescimento das plantas. Não estou particularmente interessado nesse efeito, mas gostaria de explicar a variação que ele causa. Realmente, meu principal interesse é nos efeitos da densidade de aranhas (hipótese: aumento da densidade de aranhas causa aumento de plantas - presumivelmente através da redução de insetos herbívoros, mas estou testando apenas o efeito, e não o mecanismo). Eu poderia adicionar o efeito de N inorgânico à minha análise.
Para o bem da minha pergunta, vamos fingir que eu testei a densidade de interação * inorganicN e ela não é significativa; por isso, removo-a da análise e execute os seguintes efeitos principais:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Agora, faz diferença se eu uso SS Tipo I ou Tipo II (sei que algumas pessoas se opõem aos termos Tipo I e II etc., mas, dada a popularidade do SAS, é fácil abreviar). Renova {stats} usa o Tipo I por padrão. Posso calcular o SS do tipo II, F e P para a densidade, revertendo a ordem dos meus efeitos principais ou posso usar o pacote "car" do Dr. John Fox (associado à regressão aplicada). Prefiro o último método, pois é mais fácil para problemas mais complexos.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Meu entendimento é que as hipóteses do tipo II seriam: "Não há efeito linear de x1 em y1, dado o efeito de (manter constante?) X2" e o mesmo para x2, dado x1. Acho que é aqui que fico confuso. Qual é a hipótese que está sendo testada pela ANOVA, usando o método do tipo I (sequencial) acima, em comparação com a hipótese do método do tipo II?
Na realidade, meus dados são um pouco mais complexos, porque medi inúmeras métricas de crescimento de plantas, dinâmica de nutrientes e decomposição de lixo. Minha análise real é algo como:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16