Suponha que eu tenho 20 ratos. Eu emparelhei os ratos de alguma maneira, para obter 10 pares. Para os fins desta pergunta, pode ser um emparelhamento aleatório, OU pode ser um emparelhamento sensato, como tentar emparelhar ratos da mesma ninhada, do mesmo sexo, com peso semelhante, OU pode ser um emparelhamento deliberadamente estúpido como tentando emparelhar ratos com pesos o mais desigual possível. Em seguida, uso números aleatórios para atribuir um mouse em cada par ao grupo controle e o outro mouse ao grupo a ser tratado. Agora, faço o experimento, tratando apenas os camundongos a serem tratados, mas, de outra forma, não prestando atenção aos arranjos que acabamos de fazer.
Quando se trata de analisar os resultados, pode-se usar teste t não pareado ou teste t pareado. De que maneira, se houver alguma, as respostas serão diferentes? (Basicamente, estou interessado em diferenças sistemáticas de qualquer parâmetro estatístico que precise ser estimado.)
A razão pela qual pergunto isso é que um artigo em que estive recentemente envolvido foi criticado por um biólogo por usar um teste t emparelhado em vez de um teste t não pareado. É claro que, no experimento real, a situação não era tão extrema quanto a que descrevi, e, na minha opinião, havia boas razões para o emparelhamento. Mas o biólogo não concordou.
Parece-me que não é possível melhorar incorretamente a significância estatística (diminuir o valor-p), nas circunstâncias que esboçei, usando um teste t emparelhado, em vez de um teste não emparelhado, mesmo que seja inadequado parear. No entanto, poderia piorar a significância estatística se os camundongos estivessem muito emparelhados. Isto está certo?