Essa é uma excelente pergunta, pois mostra que você está pensando nos aspectos intuitivos dos teoremas que está aprendendo. Isso coloca você à frente da maioria dos estudantes que aprendem o CLT. Aqui, tentarei fornecer uma explicação de como é possível que o CLT retenha variáveis aleatórias com suporte restrito.
O teorema clássico do limite central se aplica a qualquer sequência consiste em variáveis aleatórias independentes e identicamente distribuídas com média arbitrária e finito variação diferente de zero . Agora, suponha que você tenha uma sequência desse tipo, e eles sejam delimitados por e, portanto, seu suporte não cobre toda a linha real.X1,X2,X3,...∼IID Dist(μ,σ2)μ0<σ2<∞xmin⩽Xi⩽xmax
O teorema do limite central refere-se à distribuição da média da amostra , e do suporte restrito às variáveis aleatórias subjacentes em Na sequência, essa estatística também deve obedecer aos limites . Assim, a trama engrossa - a média da amostra que é o assunto do teorema também é limitada! Como o CLT pode aguentar se for esse o caso?X¯n≡1n∑ni=1Xixmin⩽X¯n⩽xmax
Teorema do Limite Central (CLT): Permitindo que seja a função de distribuição normal padrão, temos:Φ
limn→∞P(X¯n−μσ/n−−√⩽z)=Φ(z).
Aproximação decorrente do CLT: Para grande , temos a distribuição aproximada :n
X¯n∼N(μ,σ2n).
Seu problema deriva do fato de que a aproximação distributiva resultante desse teorema aproxima uma distribuição com suporte limitado por outro com suporte ilimitado e, portanto, não pode estar correta. Você está certo sobre isso - a aproximação distributiva para grande é apenas uma aproximação e, de fato, especifica incorretamente a probabilidade de que a média da amostra esteja fora de seus limites (fornecendo essa probabilidade positiva).n
No entanto, o CLT não é uma afirmação sobre uma aproximação distributiva para finito . Trata-se da distribuição limitadora da média da amostra padronizada . Os limites dessa quantidade são:n
zmin=xmin−μσ/n−−√⩽X¯n−μσ/n−−√⩽xmax−μσ/n−−√=zmax.
Agora, como , temos limites e que significa que os limites da amostra padronizada se tornam mais amplos e mais amplo e converge no limite para toda a linha real. (Ou, para ser um pouco mais formal, para qualquer ponto da linha real, os limites passarão a abranger esse ponto para um número suficientemente grande de .) Uma conseqüência disso é que a probabilidade atribuída às partes fora dos limites pela normalidade a distribuição converge para zero como .n→∞zmin→−∞zmax→∞nn→∞
Aqui chegamos ao cerne da questão sobre suas dúvidas sobre o CLT. É verdade que, para qualquer finito , uma aproximação normal à distribuição da média da amostra dará probabilidade positiva a subconjuntos de valores que estão fora dos limites do suporte verdadeiro. No entanto, quando assumimos o limite essa probabilidade positiva errônea converge para zero. A aproximação distributiva à média da amostra padronizada converge para a verdadeira distribuição dessa quantidade no limite, mesmo que a aproximação não seja exatamente válida para finito .nn→∞n