Alguns livros afirmam que um tamanho de amostra de tamanho 30 ou superior é necessário para que o teorema do limite central forneça uma boa aproximação para .X¯
Essa regra geral é praticamente completamente inútil. Existem distribuições não normais para as quais n = 2 fará distribuições normais e não normais para as quais muito maior é insuficiente - portanto, sem uma restrição explícita às circunstâncias, a regra é enganosa. De qualquer forma, mesmo que fosse verdade, o necessário variaria dependendo do que você estava fazendo. Frequentemente, você obtém boas aproximações perto do centro da distribuição em pequeno , mas precisa de muito maior para obter uma aproximação decente na cauda.n n nnnnn
Editar: Veja as respostas a esta pergunta para opiniões numerosas, mas aparentemente unânimes sobre esse assunto, e alguns bons links. Não vou insistir no assunto, já que você já o entende claramente.
Estou querendo ver alguns exemplos de distribuições em que, mesmo com um tamanho de amostra grande (talvez 100 ou 1000 ou superior), a distribuição da média da amostra ainda seja bastante distorcida.
Exemplos são relativamente fáceis de construir; Uma maneira fácil é encontrar uma distribuição infinitamente divisível que não seja normal e dividi-la. Se você tem um que se aproxima do normal quando faz a média ou o resumo, comece no limite de 'próximo ao normal' e divida-o quanto quiser. Então, por exemplo:
Considere uma distribuição gama com o parâmetro de forma . Pegue a escala como 1 (escala não importa). Digamos que você considere como "suficientemente normal". Então, uma distribuição para a qual você precisa obter 1000 observações para ser suficientemente normal possui uma distribuição . Gama ( α 0 , 1 ) Gama ( α 0 / 1000 , 1 )αGama ( α0 0, 1 )Gama ( α0 0/ 1000,1)
Portanto, se você achar que um Gamma com é apenas 'normal o suficiente' -α = 20
Em seguida, divida por 1000, para obter :α = 0,02α = 20α = 0,02
A média de 1000 delas terá a forma do primeiro pdf (mas não a sua escala).
Se você escolher uma distribuição infinitamente divisível que não se aproxima do normal, como o Cauchy, talvez não haja tamanho de amostra no qual os meios de amostra tenham distribuições aproximadamente normais (ou, em alguns casos, eles ainda podem se aproximar da normalidade, mas você não tem um efeito para o erro padrão).σ/ n--√
O argumento do @ whuber sobre distribuições contaminadas é muito bom; pode ser bom tentar algumas simulações nesse caso e ver como as coisas se comportam em muitas dessas amostras.