Essa pergunta foi desencadeada por algo que li neste livro de estatística em nível de pós-graduação e também (independentemente) ouvi durante esta apresentação em um seminário de estatística. Nos dois casos, a declaração foi semelhante à "porque o tamanho da amostra é bem pequeno, decidimos realizar uma estimativa via bootstrap em vez de (ou juntamente com) esse método paramétrico ".
Eles não entrar em detalhes, mas provavelmente o raciocínio era o seguinte: Método assume os dados seguem uma certa paramétrico distribuição . Na realidade, a distribuição não é exatamente , mas é aceitável desde que o tamanho da amostra seja grande o suficiente. Como neste caso o tamanho da amostra é muito pequeno, vamos mudar para o bootstrap (não paramétrico) que não faz nenhuma suposição de distribuição. Problema resolvido!
Na minha opinião, não é para isso que serve o bootstrap. Aqui está como eu vejo: o bootstrap pode dar uma vantagem quando é mais ou menos óbvio que existem dados suficientes, mas não existe uma solução de formulário fechado para obter erros padrão, valores-p e estatísticas semelhantes. Um exemplo clássico é a obtenção de um IC para o coeficiente de correlação, dada uma amostra de uma distribuição normal bivariada: a solução de formulário fechado existe, mas é tão complicada que a inicialização é mais simples. No entanto, nada implica que o bootstrap possa de alguma forma ajudar alguém a se safar com um pequeno tamanho de amostra.
Minha percepção está certa?
Se você acha essa pergunta interessante, há outra pergunta de bootstrap mais específica de mim:
Bootstrap: a questão do overfitting
PS: Não posso deixar de compartilhar um exemplo flagrante da "abordagem de inicialização". Não estou divulgando o nome do autor, mas ele é um dos “quantos” da geração mais antiga que escreveu um livro sobre Quantitative Finance em 2004. O exemplo é retirado de lá.
Considere o seguinte problema: suponha que você tenha 4 ativos e 120 observações mensais de retorno para cada um. O objetivo é construir o cdf 4-dimensional conjunto de retornos anuais. Mesmo para um único ativo, a tarefa parece dificilmente alcançável com apenas 10 observações anuais, sem falar na estimativa do cdf 4-dimensional. Mas não se preocupe, o “bootstrap” o ajudará: faça todas as observações quadridimensionais disponíveis, faça uma nova amostra de 12 com substituição e componha-as para construir um único vetor quadridimensional “bootstrapped” de retornos anuais. Repita isso 1000 vezes e, eis que você obteve uma "amostra de autoinicialização" de 1000 retornos anuais. Use isso como uma amostra de tamanho IID do tamanho 1000 para fins de estimativa de cdf ou qualquer outra inferência que possa ser extraída de uma história de mil anos.