Digamos que eu tenho duas condições, e meu tamanho de amostra para as duas condições é extremamente baixo. Digamos que só tenho 14 observações na primeira condição e 11 na outra. Eu quero usar o teste t para testar se as diferenças médias são significativamente diferentes umas das outras.
Primeiro, estou um pouco confuso sobre a suposição de normalidade do teste t, e talvez seja por isso que não estou totalmente entendendo o bootstrap. É a suposição para o teste t de que (A) os dados são amostrados de uma população normal ou (B) que suas distribuições de amostras têm propriedades gaussianas? Se for (B), então não é realmente uma suposição, certo? Você pode plotar um histograma de seus dados e ver se é normal ou não. Se o tamanho da minha amostra for baixo, não terei pontos de dados suficientes para ver se a distribuição da minha amostra é normal.
É aqui que acho que o bootstrap entra. Posso inicializar para ver se minha amostra é normal, certo? No começo, pensei que a inicialização sempre resultaria em uma distribuição normal, mas esse não é o caso (a reamostragem da inicialização pode ser usada para calcular um intervalo de confiança para a variação de um conjunto de dados? Statexchange statexchange ). Portanto, uma das razões pelas quais você inicializaria é ter mais certeza da normalidade dos dados da amostra, correto?
Neste ponto, fico completamente confuso. Se eu realizar um teste t em R com a função t.test e colocar os vetores de amostra inicializados como as duas amostras independentes, meu valor t simplesmente se torna insanamente significativo. Não estou fazendo o teste t de inicialização certo? Não devo, porque tudo o que o bootstrap está fazendo é apenas aumentar meu valor t, isso não aconteceria em todos os casos? As pessoas não realizam um teste t nas amostras com bootstrap?
Por fim, qual é o benefício de calcular os intervalos de confiança em um bootstrap versus os intervalos de confiança da nossa amostra original? O que esses intervalos de confiança me dizem que os intervalos de confiança nos dados da amostra original não?
Acho que estou confuso sobre (A) por que usar um bootstrap se ele apenas tornará meu valor t mais significativo, (B) inseguro sobre a maneira correta de utilizar o bootstrapping ao executar um teste t de amostra independente e (C) inseguro como relatar a justificativa, execução e resultados do bootstrapping em situações independentes de teste t.