Eliminarei todos os detalhes e experimentos biológicos e citarei apenas o problema em questão e o que fiz estatisticamente. Gostaria de saber se está certo e, se não, como proceder. Se os dados (ou minha explicação) não forem claros o suficiente, tentarei explicar melhor editando.
Suponha que eu tenha dois grupos / observações, X e Y, com tamanho e . Gostaria de saber se os meios dessas duas observações são iguais. Minha primeira pergunta é:
Se as premissas forem atendidas, é relevante usar aqui um teste t paramétrico de duas amostras? Eu pergunto isso porque, pelo meu entendimento, é geralmente aplicado quando o tamanho é pequeno?
Plotei histogramas de X e Y e eles não eram normalmente distribuídos, uma das suposições de um teste t de duas amostras. Minha confusão é que considero duas populações e foi por isso que verifiquei a distribuição normal. Mas então estou prestes a realizar um teste t de duas amostras ... Isso está certo?
Do teorema do limite central, entendo que se você realizar amostragens (com / sem repetição, dependendo do tamanho da sua população) várias vezes e calcular a média das amostras a cada vez, será distribuído aproximadamente normalmente. E a média dessas variáveis aleatórias será uma boa estimativa da média da população. Então, decidi fazer isso em X e Y, 1000 vezes, e obtive amostras, e designei uma variável aleatória à média de cada amostra. A trama era muito normalmente distribuída. As médias de X e Y foram de 4,2 e 15,8 (iguais à população + - 0,15) e a variação foi de 0,95 e 12,11.
Eu realizei um teste t nessas duas observações (1000 pontos de dados cada) com variações desiguais, porque são muito diferentes (0,95 e 12,11). E a hipótese nula foi rejeitada.
Isso faz algum sentido? Essa abordagem correta / significativa ou um teste z de duas amostras são suficientes ou estão totalmente errados?Também realizei um teste não paramétrico de Wilcoxon apenas para ter certeza (nos X e Y originais) e a hipótese nula foi convincentemente rejeitada lá também. No caso em que meu método anterior estivesse totalmente errado, suponho que fazer um teste não paramétrico seja bom, exceto pelo poder estatístico, talvez?
Nos dois casos, as médias foram significativamente diferentes. No entanto, gostaria de saber se uma ou ambas as abordagens estão com defeito / totalmente erradas e, em caso afirmativo, qual é a alternativa?