Esta é uma pergunta posterior ao que Frank Harrell escreveu aqui :
Na minha experiência, o tamanho da amostra necessário para que a distribuição t seja precisa é geralmente maior que o tamanho da amostra em questão. O teste de postos assinados de Wilcoxon é extremamente eficiente, como você disse, e é robusto, então eu quase sempre prefiro o teste t
Se eu entendi direito - ao comparar a localização de duas amostras sem correspondência, preferimos usar o teste de soma e classificação de Wilcoxon sobre o teste t não pareado, se o tamanho da amostra for pequeno.
Existe uma situação teórica em que preferimos o teste de soma e classificação de Wilcoxon ao teste t não pareado, mesmo que o tamanho da amostra de nossos dois grupos seja relativamente grande?
Minha motivação para esta pergunta decorre da observação de que, para um único teste t de amostra, usá-lo para uma amostra não tão pequena de uma distribuição distorcida resultará em um erro incorreto do tipo I:
n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572 # "wrong" type I error