Resposta: .Θ(mnlogn−−−−−√)
Aplicando uma versão multidimensional do Teorema do Limite Central, obtemos que o vetor possui distribuição gaussiana assintoticamente multivariada com
e
Vamos assumir abaixo que é um vetor gaussiano (e não apenas aproximadamente um vetor gaussiano). Vamos adicionar uma variável aleatória gaussiana com variância a todos os ( é independente de todos os ). Ou seja, vamos
V a r [ X i ] = m ( 1(X1,…,Xn)Cov(Xi,Xj)=-m/n2. XZm/n2XiZ
Var[Xi]=m(1n−1n2),
Cov(Xi,Xj)=−m/n2.
X Zm/n2XiZ( Y 1 Y 2 ⋮ Y n ) = ( X 1 + Z X 2 + Z ⋮ X n + Z ) . ( Y 1Xi⎛⎝⎜⎜⎜⎜Y1Y2⋮Yn⎞⎠⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜X1+ZX2+Z⋮Xn+Z⎞⎠⎟⎟⎟⎟.
Temos um vetor gaussiano . Agora, cada tem variação :
e todos os são independentes:
Y i m / n V um r [ Y i ] = V um r [ X i ] + 2 C O v ( X i , Z ) ⏟ =(Y1,…,Yn)Yim/nYiVar[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
YiCov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.
Observe que . Portanto, nosso problema original é equivalente ao problema de encontrar . Vamos primeiro simplificar a análise do caso em que todos os têm variação .Y m a x - Y s e c - m a x Y i 1Yi−Yj=Xi−XjYmax−Ysec−maxYi1
Problema. Nós recebemos rv gaussiano independente com média e variância . Estime a expectativa de .γ 1 , ... , γ n μ 1 γ m um x - γ s e c - m um xnγ1,…,γnμ1γmax−γsec−max
Resposta: .Θ(1logn√)
Prova informal.
Aqui está uma solução informal para esse problema (não é difícil torná-lo formal). Como a resposta não depende da média, assumimos que . Vamos , onde . Temos (para moderadamente grande ),
μ=0Φ¯(t)=Pr[γ>t]γ∼N(0,1)t
Φ¯(t)≈12π−−√te−12t2.
Observe que
Φ(γi) são distribuídos de maneira uniforme e independente em ,[0,1]
Φ(γmax) é o menor entre ,Φ(γi)
Φ(γsec−max) é o segundo menor entre .Φ(γi)
Portanto, está próximo de e está próximo de (não há concentração, mas se não usarmos ' não se preocupam com constantes, essas estimativas são boas o suficiente; na verdade, são muito boas se nos importamos com constantes - mas isso precisa de uma justificativa). Usando a fórmula para , obtemos
Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)
2≈Φ¯(γsec−max)/Φ¯(γmax)≈e12(γ2max−γ2sec−max).
Portanto, é whp Observe que . Temos,
γ2max−γ2sec−maxΘ(1)γmax≈γsec−max=Θ(logn−−−−√)
γmax−γsec−max≈Θ(1)γmax+γsec−max≈Θ(1)logn−−−−√.
QED
Entendemos que
E[Xmax−Xsec−max]=E[Ymax−Ysec−max]=Var[Yi]−−−−−−√×E[γmax−γsec−max]=Θ(mnlogn−−−−−−√).
O mesmo argumento continua quando temos pontuações arbitrárias. Isso mostra que
E[Xmax−Xsec−max]=cE[Xmax−Xmin]/logn.