Sabemos que um teste t emparelhado é apenas um caso especial de ANOVA unidirecional de medidas repetidas (ou dentro do sujeito), bem como modelo linear de efeitos mistos, que pode ser demonstrado com a função lme (), o pacote nlme em R como mostrado abaixo.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Quando executo o seguinte teste t emparelhado:
t.test(x1, x2, paired = TRUE)
Eu obtive este resultado (você obterá um resultado diferente por causa do gerador aleatório):
t = -2.3056, df = 9, p-value = 0.04657
Com a abordagem ANOVA, podemos obter o mesmo resultado:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Agora posso obter o mesmo resultado no lme com o modelo a seguir, assumindo uma matriz de correlação simétrica definida positiva para as duas condições:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
Ou outro modelo, assumindo uma simetria composta para a matriz de correlação das duas condições:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Com o teste t emparelhado e a ANOVA de medidas repetidas unidirecionais, posso escrever o modelo tradicional de média de células como
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
onde i indexa a condição, j indexa o sujeito, Y ij é a variável de resposta, μ é constante para o efeito fixo para a média geral, α i é o efeito fixo para a condição, β j é o efeito aleatório do sujeito após N (0, σ p 2 ) (σ p 2 é variação da população) e ε ij é residual após N (0, σ 2 ) (σ 2 é a variação dentro do sujeito).
Eu pensei que o modelo de média de células acima não seria apropriado para os modelos lme, mas o problema é que não consigo criar um modelo razoável para as duas abordagens lme () com a suposição da estrutura de correlação. O motivo é que o modelo lme parece ter mais parâmetros para os componentes aleatórios do que o modelo de média de células acima oferece. Pelo menos o modelo lme fornece exatamente o mesmo valor F, graus de liberdade e valor p, o que os gls não podem. Mais especificamente, gls fornece DFs incorretos devido ao fato de que ele não explica o fato de que cada sujeito tem duas observações, levando a DFs muito inflados. O modelo lme provavelmente é superparâmetro na especificação dos efeitos aleatórios, mas não sei qual é o modelo e quais são os parâmetros. Portanto, o problema ainda não foi resolvido para mim.