Eu tenho dados para dois grupos (ou seja, amostras) que desejo comparar, mas o tamanho total da amostra é pequeno (n = 29) e fortemente desequilibrado (n = 22 vs n = 7).
Esses dados são logisticamente difíceis e caros de serem coletados; portanto, 'coletar mais dados' como uma solução óbvia não é útil nesse caso.
Um número de variáveis diferentes foi medido (data de partida, data de chegada, duração da migração etc.) para que haja vários testes, alguns dos quais as variações são muito diferentes (a amostra menor apresenta uma variação maior).
Inicialmente, um colega executou testes t com esses dados, e alguns foram estatisticamente significativos com P <0,001, outro não foi significativo com P = 0,069. Algumas amostras eram normalmente distribuídas, outras não. Alguns testes envolveram grandes desvios de variações 'iguais'.
Eu tenho várias perguntas:
- os testes t são apropriados aqui? Se não, por que? Isso se aplica apenas a testes em que as suposições de normalidade e igualdade de variações são atendidas?
- o que é uma alternativa adequada? Talvez um teste de permutação?
- variação desigual infla o erro do tipo I, mas como? e que efeito o tamanho pequeno e desequilibrado da amostra tem no erro do tipo I?