Como ( como é sabido ) uma distribuição uniforme na esfera unitária é obtida normalizando uma distribuição normal variável e o produto escalar de vetores normalizados é seu coeficiente de correlação, as respostas para as três perguntas são: D tSD−1Dt
( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 tem uma distribuição Beta .( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
A variação de é igual a (conforme especulado na pergunta).1 / Dt1 / D
A distribuição padronizada de aproxima da normalidade a uma taxa deO ( 1tO ( 1D) .
Método
A distribuição exata do produto escalar dos vetores unitários é facilmente obtida geometricamente, porque esse é o componente do segundo vetor na direção do primeiro. Como o segundo vetor é independente do primeiro e é uniformemente distribuído na esfera unitária, seu componente na primeira direção é distribuído da mesma forma que qualquer coordenada da esfera. (Observe que a distribuição do primeiro vetor não importa.)
Encontrando a densidade
Deixando que a coordenada seja a última, a densidade em é, portanto, proporcional à área da superfície situada a uma altura entre e na esfera unitária. Essa proporção ocorre dentro de uma faixa de altura e raio que é essencialmente um tronco cônico construído a partir de um de raio de altura e inclinação . De onde a probabilidade é proporcional at t + d t d t √t ∈ [ - 1 , 1 ]tt + dtdt1 - t2-----√,√SD - 2d t 1 / √1 - t2-----√,dt1 / 1 - t2-----√
( 1 - t2-----√)D - 21 - t2-----√dt = ( 1 - t2)( D - 3 ) / 2dt .
Deixar implica . Substituindo isso no precedente, o elemento de probabilidade é convertido em uma constante de normalização:u = ( t + 1 ) / 2 × [ 0 , 1 ]t = 2 u - 1
fD( u ) dvocê∝( 1 - ( 2 u - 1 )2)( D - 3 ) / 2d( 2 u - 1 ) = 2D - 2( u - u2)( D - 3 ) / 2du .
É imediato que tenha uma distribuição Beta , porque (por definição) sua densidade também é proporcional a( ( D - 1 ) / 2 , ( D - 1u = ( t + 1 ) / 2( ( D - 1 ) / 2 , ( D - 1 ) / 2 )
você(D−1)/2−1(1−u)(D−1)/2−1=(u−u2)(D−3)/2∝fD(u).
Determinando o comportamento limitante
As informações sobre o comportamento limitador seguem facilmente isso usando técnicas elementares: pode ser integrado para obter a constante de proporcionalidade ; pode ser integrado (usando propriedades das funções Beta, por exemplo) para obter momentos, mostrando que a variação é e diminui para (daí, pelo Teorema de Chebyshev, a probabilidade está se concentrando perto de ); ea distribuição limitadora é então encontrada considerando valores da densidade da distribuição padronizada, proporcional a para valores pequenos defDtkfD(t)1/D0t=0fDΓ(n2)π√Γ(D−12)tkfD(t)1/D0t=0fD(t/D−−√),t :
log(fD(t/D−−√))=C(D)+D−32log(1−t2D)=C(D)−(1/2+32D)t2+O(t4D)→C−12t2
onde os representam constantes (log) de integração. Evidentemente, a taxa na qual isso se aproxima da normalidade (para a qual a densidade do log é igual a ) éCO- 12t2O ( 1D) .
Este gráfico mostra as densidades do produto escalar para , conforme padronizado para a variação unitária, e sua densidade limitante. Os valores em aumentam com (de azul a vermelho, dourado e depois verde para a densidade normal padrão). A densidade para seria indistinguível da densidade normal nesta resolução.0 D D = 1000D = 4 , 6 , 100 0DD=1000