A declaração clássica do teorema do limite central (CLT) considera uma sequência de variáveis independentes, distribuídas de forma idêntica aleatórios com distribuição comum . Essa sequência modela a situação que enfrentamos ao projetar um programa ou experimento de amostragem: se podemos obter observações independentes do mesmo fenômeno subjacente, a coleção finita modela os dados previstos. Permitir que a sequência seja infinita é uma maneira conveniente de considerar tamanhos de amostra arbitrariamente grandes.F n X 1 , X 2 , … , X nX1, X2, … , Xn, …FnX1, X2, … , Xn
Várias leis de grandes números afirmam que a média
m(X1,X2,…,Xn)=1n(X1+X2+⋯+Xn)
abordará de perto a expectativa de , , com alta probabilidade, desde que realmente tenha uma expectativa. (Nem todas as distribuições fazem isso.) Isso implica no desvio (que, em função dessas variáveis aleatórias, também é uma variável aleatória) tenderá a obter menor à medida que aumenta. A CLT contribui para isso de uma maneira muito mais específica: ele afirma (sob algumas condições, que discutirei adiante) que se redimensionar esse desvio por , terá uma função de distribuição que aborda alguns zero função de distribuição normal média comoFμ(F)Fm(X1,X2,…,Xn)−μ(F)nnn−−√Fnncresce grande. (Minha resposta em https://stats.stackexchange.com/a/3904 tenta explicar por que isso ocorre e por que o fator é o correto a ser usado.)n−−√
Esta não é uma declaração padrão do CLT. Vamos conectá-lo com o habitual. Essa distribuição normal média com limitação zero será completamente determinada por um segundo parâmetro, que geralmente é escolhido para ser uma medida de sua propagação (naturalmente!), Como sua variação ou desvio padrão. Seja sua variação. Certamente ele deve ter alguma relação com uma propriedade semelhante de . Para descobrir o que pode ser isso, deixe ter uma variação que pode ser infinita, a propósito. Independentemente disso, como os são independentes, calculamos facilmente a variação dos meios:σ2FFτ2Xi
Var(m(X1,X2,…,Xn))=Var(1n(X1+X2+⋯+Xn))=(1n)2(Var(X1)+Var(X2)+⋯+Var(Xn))=(1n)2(τ2+τ2+⋯+τ2)=τ2n.
Consequentemente, a variação dos resíduos padronizados é igual a : é constante. A variação da distribuição normal limitante, portanto, deve ser . (Isso mostra imediatamente que o teorema pode ser mantido apenas quando é finito: essa é a suposição adicional que eu examinei anteriormente.)τ2/n×(n−−√)2=τ2τ2τ2
(Se tivéssemos escolhido qualquer outra medida de spread de , ainda poderíamos conectá-lo a , mas não teríamos descoberto que a medida correspondente de spread do desvio médio padronizado é constante para todos os , que é uma simplificação bonita - embora não essencial -.)Fσ2n
Se quiséssemos, poderíamos padronizar os desvios médios o tempo todo dividindo-os por e multiplicando-os por . Isso garantiria que a distribuição limitadora fosse normal normal, com variação unitária. Se você optar por padronizar por dessa maneira ou não, é realmente uma questão de gosto: é o mesmo teorema e a mesma conclusão no final. O que importava era a multiplicação por .τn−−√τn−−√
Observe que você pode multiplicar os desvios por algum fator diferente de . Você pode usar ou ou qualquer outra coisa que se comporte assintoticamente como . Qualquer outra forma assintótica, no limite, reduziria a ou explodiria a . Essa observação refina nossa apreciação do CLT, mostrando até que ponto ele é flexível com relação ao desempenho da padronização. Podemos querer indicar o CLT, então, da seguinte maneira.n−−√n−−√+exp(−n)n1/2+1/nn−−√σ20∞
Desde que o desvio entre a média de uma sequência de variáveis IID (com distribuição comum ) e a expectativa subjacente seja escalado assintoticamente por , esse desvio escalado terá uma distribuição limitadora Normal com média zero cuja variação é a de .Fn−−√F
Embora as variações estão envolvidos na demonstração, eles aparecem apenas porque eles são necessários para caracterizar a distribuição normal limitante e relacionar a sua propagação ao da . Este é apenas um aspecto incidental. Não tem nada a ver com a variação ser "melhor" em qualquer sentido. O cerne da questão é o redimensionamento assintótico de .Fn−−√