Como o teorema do limite central pode valer para distribuições que têm limites para a variável aleatória?


10

Eu sempre discordei, e nunca recebi uma boa resposta, de como é possível que o teorema do limite central - a versão clássica em que a distribuição da amostra se aproxima da normalidade - possa ser aplicado para dizer uma distribuição de Poisson ou Gama, em que . Ou, nesse caso, qualquer outra distribuição para a qual , ou talvez .P(x<0)=0X:X,F(X)=0X:X,1F(X)=0

Como exemplo, dada uma distribuição Gamma, como o número de amostras , , , para alguns . Mas se , . Simplesmente nunca, NUNCA haverá um . Isso me sugere que a distribuição de não pode ser, nem se aproximar, da normalidade porque deve necessariamente ser , , que não atende aos requisitos de uma distribuição normal, onde .nP(X¯=α)1α0X¯iα<0P(X¯=α)=0X¯i<0X¯f(X¯)0X¯<0f(y)>0,yR

Eu me sentiria muito melhor com a vida e qualquer coisa baseada no CLT se alguém pudesse me ajudar a entender para onde minha lógica se desviava.


6
A formulação original do CLT aplicada à variável Bernoulli : o exemplo com os limites mais rigorosos possíveis! Por que não, então, considere esse caso específico em sua busca pelo erro na lógica. Se a resposta não se tornar imediatamente aparente (dica: pense no que significa a padronização), talvez minha conta em stats.stackexchange.com/questions/3734/… sugira algumas idéias.
whuber

4
Talvez ajude dar uma olhada no que realmente diz uma versão básica do teorema do limite central e, a partir daí, considere como são os limites no meio padronizado.
Glen_b -Reinstala Monica

Respostas:


14

Essa é uma excelente pergunta, pois mostra que você está pensando nos aspectos intuitivos dos teoremas que está aprendendo. Isso coloca você à frente da maioria dos estudantes que aprendem o CLT. Aqui, tentarei fornecer uma explicação de como é possível que o CLT retenha variáveis ​​aleatórias com suporte restrito.

O teorema clássico do limite central se aplica a qualquer sequência consiste em variáveis ​​aleatórias independentes e identicamente distribuídas com média arbitrária e finito variação diferente de zero . Agora, suponha que você tenha uma sequência desse tipo, e eles sejam delimitados por e, portanto, seu suporte não cobre toda a linha real.X1,X2,X3,...IID Dist(μ,σ2)μ0<σ2<xminXixmax

O teorema do limite central refere-se à distribuição da média da amostra , e do suporte restrito às variáveis ​​aleatórias subjacentes em Na sequência, essa estatística também deve obedecer aos limites . Assim, a trama engrossa - a média da amostra que é o assunto do teorema também é limitada! Como o CLT pode aguentar se for esse o caso?X¯n1ni=1nXixminX¯nxmax

Teorema do Limite Central (CLT): Permitindo que seja a função de distribuição normal padrão, temos:Φ

limnP(X¯nμσ/nz)=Φ(z).

Aproximação decorrente do CLT: Para grande , temos a distribuição aproximada :n

X¯nN(μ,σ2n).

Seu problema deriva do fato de que a aproximação distributiva resultante desse teorema aproxima uma distribuição com suporte limitado por outro com suporte ilimitado e, portanto, não pode estar correta. Você está certo sobre isso - a aproximação distributiva para grande é apenas uma aproximação e, de fato, especifica incorretamente a probabilidade de que a média da amostra esteja fora de seus limites (fornecendo essa probabilidade positiva).n

No entanto, o CLT não é uma afirmação sobre uma aproximação distributiva para finito . Trata-se da distribuição limitadora da média da amostra padronizada . Os limites dessa quantidade são:n

zmin=xminμσ/nX¯nμσ/nxmaxμσ/n=zmax.

Agora, como , temos limites e que significa que os limites da amostra padronizada se tornam mais amplos e mais amplo e converge no limite para toda a linha real. (Ou, para ser um pouco mais formal, para qualquer ponto da linha real, os limites passarão a abranger esse ponto para um número suficientemente grande de .) Uma conseqüência disso é que a probabilidade atribuída às partes fora dos limites pela normalidade a distribuição converge para zero como .nzminzmaxnn

Aqui chegamos ao cerne da questão sobre suas dúvidas sobre o CLT. É verdade que, para qualquer finito , uma aproximação normal à distribuição da média da amostra dará probabilidade positiva a subconjuntos de valores que estão fora dos limites do suporte verdadeiro. No entanto, quando assumimos o limite essa probabilidade positiva errônea converge para zero. A aproximação distributiva à média da amostra padronizada converge para a verdadeira distribuição dessa quantidade no limite, mesmo que a aproximação não seja exatamente válida para finito .nnn


3

Sua fonte de confusão deriva de duas fontes:

1) O CLT aplica-se aos meios normalizados da amostra, ou seja:

Zn=Sn/nμσ/n=Snnμσn ,

que é centrado em torno de 0, portanto, admite valores negativos com probabilidade positiva. Como um exemplo extremo, se então pode ser negativo para Poisson . De fato, você pode concluir facilmente que, se nunca for negativo, deverá ser constante (portanto ).n=1X1μσX1ZnXiσ=0

2) O CLT para finito é apenas um resultado local em torno da média. Em outras palavras, o fato de que é aproximadamente (o CDF normal), normal tende a ser mais verdadeiro para próximo a 0. Quando não for grande o suficiente, em relação a , isso aproximação quebra.nP(Znx)ϕ(x)xnx

Se você diz, medindo a altura das pessoas, uma aproximação normal padrão pode implicar que a altura negativa tem probabilidade positiva. Isso é falso, já que a maioria dos adultos tem alturas entre 4 e 7 pés; portanto, a aproximação quebraria além desses limites se seu for pequeno.n

Como alternativa, se e , serão necessárias muitas realizações de para inferir situações em que é negativo, de modo que seja principalmente positivo, e você pode ( erroneamente) concluem que nunca pode ser negativo.P(Xi=1)=0.99999P(Xi=1)=0.00001XiXiZn

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.