Com as informações fornecidas por @Glen_b eu pude encontrar a resposta. Usando as mesmas notações da pergunta
P(Zk≤x)=∑j=0k+1(k+1j)(−1)j(1−jx)k+,
onde se e caso contrário. Dou também a expectativa e a convergência assintótica ao Gumbel ( NB :a+=aa>00 distribuição de não Beta)
E(Zk)=1k+1∑i=1k+11i∼log(k+1)k+1,P(Zk≤x)∼exp(−e−(k+1)x+log(k+1)).
O material das provas é retirado de várias publicações vinculadas nas referências. Eles são um pouco longos, mas diretos.
1. Prova da distribuição exata
Seja as variáveis aleatórias uniformes do no intervalo . Ao solicitá-los, obtemos as estatísticas de ordens indicadas . Os espaçamentos uniformes são definidos como , com e . Os espaçamentos ordenados são as estatísticas ordenadas correspondentes . A variável de interesse é .(U1,…,Uk)(0,1)k(U(1),…,U(k))Δi=U(i)−U(i−1)U(0)=0U(k+1)=1Δ(1)≤…≤Δ(k+1)Δ(k+1)
Para fixo , definimos a variável indicadora . Por simetria, o vetor aleatório é permutável, portanto, a distribuição conjunta de um subconjunto de tamanho é igual à distribuição conjunta de o primeirox∈(0,1)1i=1{Δi>x}(11,…,1k+1)jj . Expandindo o produto, obtemos assim
P(Δ(k+1)≤x)=E(∏i=1k+1(1−1i))=1+∑j=1k+1(k+1j)(−1)jE(∏i=1j1i).
Agora provaremos que , que estabelecerá a distribuição fornecida acima. Provamos isso para , como o caso geral é provado de maneira semelhante.E(∏ji=11i)=(1−jx)k+j=2
E(∏i=121i)=P(Δ1>x∩Δ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).
Se , os pontos de interrupção estão no intervalo . Condicionalmente nesse evento, os pontos de interrupção ainda são intercambiáveis, portanto, a probabilidade de que a distância entre o segundo e o primeiro ponto de interrupção seja maior que é igual à probabilidade de que a distância entre o primeiro ponto de interrupção e a barreira esquerda (na posição ) é maior queΔ1>xk(x,1)xxx . tão
P(Δ2>x|Δ1>x)=P(all points are in (2x,1)∣∣all points are in (x,1)),soP(Δ2>x∩Δ1>x)=P(all points are in (2x,1))=(1−2x)k+.
2. Expectativa
Para distribuições com suporte finito, temos
E(X)=∫P(X>x)dx=1−∫P(X≤x)dx.
Integrando a distribuição de , obtemosΔ(k+1)
E(Δ(k+1))=1k+1∑j=1k+1(k+1j)(−1)j+1j=1k+1∑j=1k+11j.
A última igualdade é uma representação clássica de números harmônicos , que demonstramos abaixo.Hi=1+12+…+1i
Hk+1=∫101+x+…+xkdx=∫101−xk+11−xdx.
Com a mudança da variável e a expansão do produto, obtemosu=1−x
Hk+1=∫10∑j=1k+1(k+1j)(−1)j+1uj−1du=∑j=1k+1(k+1j)(−1)j+1j.
3. Construção alternativa de espaçamentos uniformes
Para obter a distribuição assintótica do maior fragmento, precisaremos exibir uma construção clássica de espaçamentos uniformes como variáveis exponenciais divididas por sua soma. A densidade de probabilidade das estatísticas de pedidos associadas (U(1),…,U(k)) é
fU(1),…U(k)(u(1),…,u(k))=k!,0≤u(1)≤…≤u(k+1).
Se denotar os espaçamentos uniformes , com , obteremosΔi=U(i)−U(i−1)U(0)=0
fΔ1,…Δk(δ1,…,δk)=k!,0≤δi+…+δk≤1.
Ao definir , obtemos assimU(k+1)=1
fΔ1,…Δk+1(δ1,…,δk+1)=k!,δ1+…+δk=1.
Agora, seja variáveis aleatórias exponenciais do com média 1 e seja . Com uma simples mudança de variável, podemos ver que(X1,…,Xk+1)S=X1+…+Xk+1
fX1,…Xk,S(x1,…,xk,s)=e−s.
Defina , de modo que, por uma mudança de variável, obtenhamosYi=Xi/S
fY1,…Yk,S(y1,…,yk,s)=ske−s.
Integrando essa densidade em relação a , obtemos assims
fY1,…Yk,(y1,…,yk)=∫∞0ske−sds=k!,0≤yi+…+yk≤1,and thusfY1,…Yk+1,(y1,…,yk+1)=k!,y1+…+yk+1=1.
Portanto, a distribuição conjunta de espaçamentos uniformes no intervalo é a mesma que a distribuição conjunta dek+1(0,1)k+1 variáveis aleatórias exponenciais divididas por sua soma. Chegamos à seguinte equivalência de distribuição
Δ(k+1)≡X(k+1)X1+…+Xk+1.
4. Distribuição assintótica
Utilizando a equivalência acima, obtemos
P((k+1)Δ(k+1)−log(k+1)≤x)=P(X(k+1)≤(x+log(k+1))X1+…+Xk+1k+1)=P(X(k+1)−log(k+1)≤x+(x+log(k+1))Tk+1),
onde . Essa variável desaparece em probabilidade porque e . Assintoticamente, a distribuição é a mesma de . Como o é IID, temosTk+1=X1+…+Xk+1k+1−1E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0X(k+1)−log(k+1)Xi
P(X(k+1)−log(k+1)≤x)=P(X1≤x+log(k+1))k+1=(1−e−x−log(k+1))k+1=(1−e−xk+1)k+1∼exp{−e−x}.
5. Visão geral gráfica
O gráfico abaixo mostra a distribuição do maior fragmento para diferentes valores de . Para , também cobri a distribuição assintótica de Gumbel (linha fina). O Gumbel é uma péssima aproximação para valores pequenos de então eu os omito para não sobrecarregar a imagem. A aproximação de Gumbel é boa a partir de .kk=10,20,50kk≈50
6. Referências
As provas acima são extraídas das referências 2 e 3. A literatura citada contém muitos outros resultados, como a distribuição dos espaçamentos ordenados de qualquer categoria, sua distribuição limite e algumas construções alternativas dos espaçamentos uniformes ordenados. As principais referências não são facilmente acessíveis, por isso também forneço links para o texto completo.
- Bairamov et al. (2010) Resultados de limite para espaçamentos uniformes ordenados , Stat papers, 51: 1, pp 227-240
- Holst (1980) Sobre os pedaços de um pedaço de pau quebrado ao acaso , J. Appl. Prob., 17, pp. 623-634
- Pyke (1965) Spacings , JRSS (B) 27: 3, pp. 395-449
- Renyi (1953) Sobre a teoria das estatísticas da ordem , Acta math Hung, 4, pp 191-231