Seja distância da origem e V 0 [ p ] seja o volume da unidade hiperesfera nas dimensões p . Então o volume contido em uma hiperesfera de raio r érV0 0[ p ]pr
V[ r ] = V0 0[ p ] rp
Se deixarmos denotar a fração do volume contido nessa hiperesfera e definir R = r p , entãoP= V[ r ] / V0 0[ p ]R = rp
P[ R ] = R
Se os pontos de dados são distribuídos uniformemente dentro da bola unitária, então para na fórmula acima é uma função de distribuição cumulativa (CDF) para R . Isso é equivalente a uma densidade de probabilidade uniforme para R no intervalo de unidades, ou seja, p [ R ] = P ′ [ R ] = 1 . Assim, como sugerido por Mark Stone nos comentários, podemos reduzir ocaso dimensional p para um problema 1D equivalente.0 ≤ R ≤ 1RRp [ R ] = P′[ R ] = 1p
Agora, se tivermos um único ponto , então, por definição de um CDF, temos Pr [ R ≤ ρ ] = P [ ρ ] e Pr [ R ≥ ρ ] = 1RPr [ R ≤ ρ ] = P[ ρ ] . Se R min é o menor valor dentre n pontos e todos os pontos são independentes, o CDF para é dado por
Pr [ R min ≥ ρ ] = Pr [ R ≥ ρ ]Pr [ R ≥ ρ ] = 1 - P[ ρ ]Rminn
(este é um resultado padrão dateoriaunivariada devalores extremos).
Pr [ Rmin≥ ρ ] = Pr [ R ≥ ρ ]n= ( 1 - ρ )n
Por definição da mediana, temos
que podemos reescrever como
(1-dp)n=1
1 12= Pr [ ( Rmin)m e d≥ R ] = ( 1 - R )n
que é equivalente ao resultado desejado.
( 1 - dp)n= 12
Edição: tentativa de resposta estilo " ELI5 ", em três partes.
[ 0 , 1 ]1 12
nn
prrp