Eu tenho uma amostra (do tamanho 250) de uma população. Eu não sei a distribuição da população.
A principal questão: quero uma estimativa pontual do 1º percentual da população e, em seguida, quero um intervalo de confiança de 95% em torno da minha estimativa pontual.
Minha estimativa de pontos será a amostra do primeiro percentual. Eu denoto isso .
Depois disso, tento construir o intervalo de confiança em torno da estimativa pontual. Gostaria de saber se faz sentido usar o bootstrap aqui. Sou muito inexperiente com o bootstrap, então, desculpe se não conseguir usar a terminologia apropriada etc.
Aqui está como eu tentei fazê-lo. Eu colho 1000 amostras aleatórias com substituição da minha amostra original. Eu obtenho o 1º percentual de cada um deles. Assim eu tenho 1000 pontos - "o 1 st -percentiles". Eu olho para a distribuição empírica desses 1000 pontos. Denoto a média disso . Denoto um "viés" da seguinte maneira: viés = x m e a n - x . Tomo a 2,5 º -percentile e 97,5 º percentil dos 1000 pontos para obter o menor eo maior efeito do que eu chamo um intervalo de confiança de 95% em todo o 1 st-percentil da amostra original. I denotar esses pontos e x 0,975 .
O último passo restante é adaptar esse intervalo de confiança para ficar em torno do 1º percentil da população em vez de em torno do 1º percentil da amostra original . Portanto, tomo como extremidade inferior e x - viés + ( x 0,975 - x m e a n ) como o limite superior do intervalo de confiança de 95% em torno da estimativa pontual 1 da população r -percentile. Este último intervalo é o que eu estava procurando.
Um importante ponto, na minha opinião, é se faz sentido a utilização de bootstrap para 1 st -percentile que é bastante perto da cauda da distribuição subjacente desconhecida da população. Eu suspeito que possa ser problemático; pense em usar o bootstrap para criar um intervalo de confiança em torno de um mínimo (ou máximo).
Mas talvez essa abordagem seja falha? Por favor deixe-me saber.
EDITAR:
Então, isso faz qualquer sentido supor que a amostra 1 st percentual é uma estimativa tendenciosa da população 1 st percentil? E se não, minha solução alternativa está correta?