Boa pergunta (+1) !!
Você lembrará que, para variáveis aleatórias independentes e , e . Portanto, a variação de é , e a variação de é .XXYYVar(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y)Var(a⋅X)=a2⋅Var(X)Var(a⋅X)=a2⋅Var(X)∑ni=1Xi∑ni=1Xi∑ni=1σ2=nσ2∑ni=1σ2=nσ2ˉX=1n∑ni=1XiX¯=1n∑ni=1Xinσ2/n2=σ2/nnσ2/n2=σ2/n
Isto é para a variação . Para padronizar uma variável aleatória, você a divide por seu desvio padrão. Como você sabe, o valor esperado de é , então a variávelˉXX¯μμ
ˉX−E(ˉX)√Var(ˉX)=√nˉX−μσ
X¯−E(X¯)Var(X¯)−−−−−−√=n−−√X¯−μσ
tem o valor esperado 0 e variância 1. Portanto, se ele tende a um gaussiano, deve ser o gaussiano padrão . Sua formulação na primeira equação é equivalente. Ao multiplicar o lado esquerdo por você define a variação para .
N(0,1)N(0,1)σσσ2σ2
Com relação ao seu segundo ponto, acredito que a equação mostrada acima ilustra que você precisa dividir por e não para padronizar a equação, explicando por que você usa (o estimador de e não .σσ√σσ−−√snsnσ)σ)√snsn−−√
Adição: @whuber sugere discutir o porquê da escala . Ele faz isso lá , mas como a resposta é muito longa, tentarei capturar a essência de seu argumento (que é uma reconstrução dos pensamentos de De Moivre).√nn−−√
Se você adicionar um grande número de + 1 e -1, poderá aproximar a probabilidade de que a soma seja por contagem elementar. O log desta probabilidade é proporcional a . Portanto, se quisermos que a probabilidade acima converja para uma constante à medida que aumenta, precisamos usar um fator de normalização em .nnjj−j2/n−j2/nnnO(√n)O(n−−√)
Usando ferramentas matemáticas modernas (post de Moivre), você pode ver a aproximação mencionada acima observando que a probabilidade procurada é
P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2−j)!
P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2−j)!
que aproximamos pela fórmula de Stirling
P(j)≈nnen/2+jen/2−j2nen(n/2+j)n/2+j(n/2−j)n/2−j=(11+2j/n)n+j(11−2j/n)n−j.
P(j)≈nnen/2+jen/2−j2nen(n/2+j)n/2+j(n/2−j)n/2−j=(11+2j/n)n+j(11−2j/n)n−j.
log(P(j))=−(n+j)log(1+2j/n)−(n−j)log(1−2j/n)∼−2j(n+j)/n+2j(n−j)/n∝−j2/n.
log(P(j))=−(n+j)log(1+2j/n)−(n−j)log(1−2j/n)∼−2j(n+j)/n+2j(n−j)/n∝−j2/n.