Fiquei me perguntando como CIs de auto-inicialização (e BCa em barticular) se comportam em dados normalmente distribuídos. Parece haver muito trabalho examinando seu desempenho em vários tipos de distribuição, mas não foi possível encontrar nada nos dados distribuídos normalmente. Como parece óbvio estudar primeiro, suponho que os papéis sejam muito antigos.
Fiz algumas simulações de Monte Carlo usando o pacote de inicialização R e constatei que os ICs de inicialização estão de acordo com os ICs exatos, embora para amostras pequenas (N <20) eles tendem a ser um pouco liberais (ICs menores). Para amostras grandes o suficiente, elas são essencialmente as mesmas.
Isso me faz pensar se existe algum bom motivo para nem sempre usar o bootstrap. Dada a dificuldade de avaliar se uma distribuição é normal e as muitas armadilhas por trás disso, parece razoável não decidir e relatar ICs de autoinicialização, independentemente da distribuição. Entendo a motivação para não usar testes não paramétricos sistematicamente, pois eles têm menos poder, mas minhas simulações me dizem que esse não é o caso dos ICs de autoinicialização. Eles são ainda menores.
Uma pergunta semelhante que me incomoda é por que nem sempre usamos a mediana como medida de tendência central. As pessoas geralmente recomendam usá-lo para caracterizar dados não distribuídos normalmente, mas como a mediana é a mesma que a média dos dados distribuídos normalmente, por que fazer uma distinção? Seria bastante benéfico se pudéssemos nos livrar dos procedimentos para decidir se uma distribuição é normal ou não.
Estou muito curioso sobre seus pensamentos sobre essas questões e se elas já foram discutidas antes. As referências seriam muito apreciadas.
Obrigado!
Pierre