Este post detalha as respostas nos comentários da pergunta.
Seja . Fixe qualquer e 1 ∈ R n do comprimento da unidade. Esse vetor sempre pode ser completado em uma base ortonormal ( e 1 , e 2 , … , e n ) (por meio do processo de Gram-Schmidt , por exemplo). Essa mudança de base (da habitual) é ortogonal: não muda de comprimento. Assim, a distribuição deX=(X1,X2,…,Xn)e1∈Rn(e1,e2,…,en)
(e1⋅X)2||X||2=(e1⋅X)2X21+X22+⋯+X2n
não depende de . Tomando e 1 = ( 1 , 0 , 0 , … , 0 ) mostra que esta tem a mesma distribuição quee1e1=(1,0,0,…,0)
X21X21+X22+⋯+X2n.(1)
Uma vez que o são iid normal, que pode ser escrito como σ vezes iid variáveis normal padrão Y 1 , ... , Y N e seus quadrados são σ 2 vezes y ( 1 / 2 ) distribuições. Uma vez que a soma de n - 1 independente Γ ( 1 / 2 ) distribuições está Γ ( ( N - 1 ) / 2 )XiσY1,…,Ynσ2Γ(1/2)n−1Γ(1/2)Γ((n−1)/2), determinamos que a distribuição de é a de(1)
σ2Uσ2U+σ2V=UU+V
onde e V = ( X 2 2 + ⋯ + X 2 n ) / σ 2 ~ Γ ( ( N - 1 ) / 2 ) são independentes. Ele é bem conhecido que esta razão tem uma Beta ( 1 / 2 , ( n - 1U=X21/σ2∼Γ(1/2)V=(X22+⋯+X2n)/σ2∼Γ((n−1)/2) distribuição. (Veja também o tópico estreitamente relacionado naDistribuição de X Y se X ∼ Beta ( 1 , K - 1 ) e Y ∼ qui-quadrado com 2 K. graus.)(1/2,(n−1)/2)XYX∼(1,K−1)Y∼2K
Como
X1+⋯+Xn=(1,1,…,1)⋅(X1,X2,⋯,Xn)=n−−√e1⋅X
para o vetor de unidade , concluímos queZé( √e1=(1,1,…,1)/n−−√Zvezes por Beta(1/2,(n-1)/2)variado. (n−−√)2=n(1/2,(n−1)/2) Para, portanto, possui função de densidaden≥2
fZ(z)=n1−n/2B(12,n−12)(n−z)n−3z−−−−−−−−−√
no intervalo (e, caso contrário, é zero).(0,n)
Como um controlo, eu simulado realizações independentes de Z para σ = 1 e n = 2 , 3 , 10 , representados graficamente os seus histogramas, e sobreposto o gráfico da densidade Beta correspondente (em vermelho). Os acordos são excelentes.100,000Zσ=1n=2,3,10
R
sum(x)^2 / sum(x^2)
Zx
n
rnorm
for
apply
hist
curve
for (n in c(2, 3, 10)) {
z <- apply(matrix(rnorm(n*1e5), nrow=n), 2, function(x) sum(x)^2 / sum(x^2))
hist(z, freq=FALSE, breaks=seq(0, n, length.out=50), main=paste("n =", n), xlab="Z")
curve(dbeta(x/n, 1/2, (n-1)/2)/n, add=TRUE, col="Red", lwd=2)
}