Podemos resolver esse problema analiticamente usando alguma intuição e argumentos geométricos . Infelizmente, a resposta é bastante longa e um pouco confusa.
Configuração básica
Primeiro, vamos definir uma notação. Suponha que desenhamos pontos uniformemente aleatoriamente a partir do retângulo . Assumimos sem perda de generalidade que . Seja as coordenadas do primeiro ponto e sejam as coordenadas do segundo ponto. Então, , ,[0,a]×[0,b]0<b<a(X1,Y1)(X2,Y2)X1X2Y1e Y2 são mutuamente independentes com Xi distribuído uniformemente em [0,a] e Yi distribuído uniformemente em [0,b].
Considere a distância euclidiana entre os dois pontos. Isto é
D=(X1−X2)2+(Y1−Y2)2−−−−−−−−−−−−−−−−−−−√=:Z21+Z22−−−−−−−√,
Onde
Z1=|X1−X2| e
Z2=|Y1−Y2|.
Distribuições triangulares
Desde a X1 e X2 são uniformes independentes, então X1−X2 tem uma distribuição triangular, de onde Z1=|X1−X2| tem uma distribuição com função de densidade
fa(z1)=2a2(a−z1),0<z1<a.
A função de distribuição correspondente é
Fa(z1)=1−(1−z1/a)2 para
0≤z1≤a. Similarmente,
Z2=|Y1−Y2| tem densidade
fb(z2) e função de distribuição
Fb(z2).
Note que desde Z1 é uma função apenas dos dois Xi e Z2 é uma função apenas do Yi, então Z1 e Z2são independentes. Portanto, a distância entre os pontos é a norma euclidiana de duas variáveis aleatórias independentes (com distribuições diferentes).
O painel esquerdo da figura mostra a distribuição de X1−X2 e o painel direito mostra Z1=|X1−X2| Onde a=5 neste exemplo.
Alguma probabilidade geométrica
assim Z1 e Z2 são independentes e são suportados em [0,a] e [0,b]respectivamente. Para fixod, a função de distribuição da distância euclidiana é
P(D≤d)=∬{z21+z22≤d2}fa(z1)fb(z2)dz1dz2.
Podemos pensar nisso geometricamente como tendo uma distribuição no retângulo e considerando um quarto de círculo de raio . Gostaríamos de saber a probabilidade que existe dentro da interseção dessas duas regiões. Há três possibilidades diferentes a serem consideradas:[0,a]×[0,b]d
Região 1 (laranja): . Aqui o quarto de círculo fica completamente dentro do retângulo.0≤d<b
Região 2 (vermelha): . Aqui o quarto de círculo cruza o retângulo ao longo das bordas superior e inferior.b≤d≤a
Região 3 (azul): . O quarto de círculo cruza o retângulo ao longo das bordas superior e direita.a<d≤a2+b2−−−−−−√
Aqui está uma figura, onde desenhamos um raio de exemplo de cada um dos três tipos. O retângulo é definido por , . O mapa de calor em escala de cinza no retângulo mostra a densidade que as áreas escuras têm maior densidade e as áreas mais claras, com menor densidade. Clicar na figura abrirá uma versão maior dela.a=5b=4fa(z1)fb(z2)dz1dz2
Algum cálculo feio
Para calcular as probabilidades, precisamos fazer algum cálculo. Vamos considerar cada uma das regiões, por sua vez, e veremos que uma integral comum surgirá. Essa integral tem uma forma fechada, embora não seja muito bonita.
Região 1 : .0≤d<b
P(D≤d)=∫d0∫d2−y2√0fb(y)fa(x)dxdy=∫d0fb(y)∫d2−y2√0fa(x)dxdy.
Agora, a integral interna produz . Portanto, resta calcular uma integral da forma
onde neste caso de interesse . A antiderivada do integrando é
1a2d2−y2−−−−−−√(2a−d2−y2−−−−−−√)
G(c)−G(0)=∫c0(b−y)d2−y2−−−−−−√(2a−d2−y2−−−−−−√)dy,
c=dG(y)=∫(b−y)d2−y2−−−−−−√(2a−d2−y2−−−−−−√)dy=a3d2−y2−−−−−−√(y(3b−2y)+2d2)+abd2tan−1(yd2−y2√)−bd2y+by33+(dy)22−y44.
A partir disso, obtemos que .P(D≤d)=2a2b2(G(d)−G(0))
Região 2 : .b≤d≤a
P(D≤d)=2a2b2(G(b)−G(0)),
pelo mesmo raciocínio que para a Região 1, mas agora precisamos integrar ao longo do eixo até vez de apenas .
ybd
Região 3 : .
a<d≤a2+b2−−−−−−√
P(D≤d)=∫d2−a2√0fb(y)dy+∫bd2−a2√fb(y)∫d2−y2√0fa(x)dxdy=Fb(d2−a2−−−−−−√)+2a2b2(G(b)−G(d2−a2−−−−−−√))
Abaixo está uma simulação de 20000 pontos onde plotamos a distribuição empírica como pontos cinzas e a distribuição teórica como uma linha, colorida de acordo com a região específica que se aplica.
A partir da mesma simulação, abaixo, plotamos os 100 primeiros pares de pontos e desenhamos linhas entre eles. Cada um é colorido de acordo com a distância entre o par de pontos e em qual região essa distância se encaixa.
O número esperado de pares de pontos dentro da distância é simplesmente
pela linearidade da expectativa.d
E[ξ]=(n2)P(D≤d),
probability
.