Pode ser instrutivo demonstrar esse resultado a partir dos primeiros princípios e resultados básicos , explorando propriedades das funções geradoras cumulantes (exatamente como nas provas padrão do Teorema do Limite Central). Isso requer que entendamos a taxa de crescimento de números harmônicos generalizados para Essas taxas de crescimento são bem conhecidas e facilmente obtidas por comparação com as integrais : elas convergem para e divergem logaritmicamente para . s = 1 ,
H( n , s ) = ∑k = 1nk- s
∫ n 1 X - s d x s > 1 s = 1s = 1 , 2 , ... .∫n1x- sdxs > 1s = 1
Seja e . Por definição, a função de geração cumulativa (cgf) de é1 ≤ k ≤ n ( X k - 1 / k ) / B nn ≥ 21 ≤ k ≤ n( Xk- 1 / k ) / Bn
ψk,n(t)=logE(exp(Xk−1/kBnt))=−tkBn+log(1+−1+exp(t/Bn)k).
A expansão em série do lado direito, obtida a partir da expansão de torno de , assume a formaz = 0log(1+z)z=0
ψk,n(t)=(k−1)2k2B2nt2+k2−3k+26k3B3nt3+⋯+kj−1−⋯±(j−1)!j!kjBjntj+⋯.
Os numeradores das frações são polinômios em com o termo inicial . Como a expansão do log converge absolutamente para , essa expansão converge absolutamente quandokkj−1∣∣−1+exp(t/Bn)k∣∣<1
|exp(t/Bn)−1|<k.
(No caso de , convergir para todos os lugares.) Para valores fixos de e crescentes de , a divergência (óbvia) de implica que o domínio da convergência absoluta se torna arbitrariamente grande. Assim, para qualquer fixo e suficientemente grande , esta expansão converge absolutamente.k=1knBntn
Para suficientemente grande , então, podemos, portanto, somar o indivíduo sobre termo por termo em potências de para obter o cgf de ,nψk,nktSn/Bn
ψn(t)=∑k=1nψk,n(t)=12t2+⋯+1Bjn(∑k=1n(k−1−⋯±(j−1)!k−j))tjj+⋯.
Assumir os termos nas somas sobre um de cada vez exige que avaliemos expressões proporcionais ak
b(s,j)=1Bjn∑k=1nk−s
para e . Usando os assintóticos dos números harmônicos generalizados mencionados na introdução, segue-se facilmente dej≥3s=1,2,…,j
B2n=H(n,1)−H(n,2)∼log(n)
naquela
b(1,j)∼(log(n))1−j/2→0
e (para )s>1
b(s,j)∼(log(n))−j/2→0
como cresce. Consequentemente, todos os termos na expansão de além de convergem para zero, de onde converge para para qualquer valor de . Como a convergência do cgf implica a convergência da função característica, concluímos pelo Teorema da Continuidade de Levy que aproxima de uma variável aleatória cujo cgf é 2/2 : essa é a variável normal padrão, QED .nψn(t)t2ψn(t)t2/2tSn/Bnt2/2
Essa análise revela quão delicada é a convergência: enquanto em muitas versões do Teorema do Limite Central o coeficiente de é (para ), aqui o coeficiente é somente : a convergência é muito mais lenta.Neste sentido, a sequência de variáveis padronizadas "apenas um pouco" se torna Normal.tjO(n1−j/2)j≥3O(((log(n))1−j/2)
Podemos ver essa lenta convergência em uma série de simulações. Os histogramas exibem iterações independentes para quatro valores de . As curvas vermelhas são gráficos de funções de densidade normal padrão para referência visual. Embora exista evidentemente uma tendência gradual à normalidade, mesmo em (onde ainda é considerável), permanece uma não normalidade considerável, como evidenciado na assimetria (igual a nesta amostra). (Não é surpresa que a assimetria desse histograma esteja próxima de , porque é exatamente isso que é o termo no cgf.) n n = 1000105nn=1000(log(n))−1/2≈0.380.35(log(n))−1/2t3
Aqui está o R
código para aqueles que gostariam de experimentar ainda mais.
set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
z <- colSums(x - 1/(1:n)) / B.n
hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}