A idéia principal é que a distribuição amostral da mediana seja simples de expressar em termos da função de distribuição, mas mais complicada de expressar em termos do valor da mediana. Uma vez que entendemos como a função de distribuição pode re-expressar valores como probabilidades e vice-versa, é fácil derivar a exata distribuição amostral da mediana. É necessária uma pequena análise do comportamento da função de distribuição perto de sua mediana para mostrar que isso é assintoticamente normal.
(A mesma análise funciona para a distribuição amostral de qualquer quantil, não apenas a mediana.)
Não farei nenhuma tentativa de ser rigoroso nesta exposição, mas realizo-a em etapas que são prontamente justificadas de maneira rigorosa, se você quiser fazer isso.
Intuição
Estes são instantâneos de uma caixa contendo 70 átomos de um gás atômico quente:
Em cada imagem, encontrei um local, mostrado como uma linha vertical vermelha, que divide os átomos em dois grupos iguais entre a esquerda (desenhada como pontos pretos) e a direita (pontos brancos). Essa é uma mediana das posições: 35 dos átomos ficam à esquerda e 35 à direita. As medianas mudam porque os átomos estão se movendo aleatoriamente ao redor da caixa.
Estamos interessados na distribuição dessa posição intermediária. Essa pergunta é respondida revertendo meu procedimento: primeiro vamos desenhar uma linha vertical em algum lugar, digamos no local . Qual é a chance de metade dos átomos estar à esquerda de e metade à sua direita? Os átomos à esquerda individualmente tinham chances de estar à esquerda. Os átomos à direita individualmente tinham chances de para estar à direita. Assumindo que suas posições são estatisticamente independentes, as chances se multiplicam, dando pela chance dessa configuração específica. Uma configuração equivalente poderia ser alcançado para uma divisão diferente dos átomos em duas= x 1 - x x 35 ( 1 - x ) 35 70 35xxx1−xx35(1−x)357035peças A adição desses números para todas essas divisões possíveis dá a chance de
Pr(x is a median)=Cxn/2(1−x)n/2
onde é o número total de átomos e é proporcional ao número de divisões de átomos em dois subgrupos iguais.C nnCn
Esta fórmula identifica a distribuição da mediana como um beta distribuição(n/2+1,n/2+1) .
Agora considere uma caixa com uma forma mais complicada:
Mais uma vez as medianas variam. Como a caixa está baixa perto do centro, não há muito volume: uma pequena mudança no volume ocupado pela metade esquerda dos átomos (os pretos mais uma vez) - ou, como podemos admitir, a área à esquerda, como mostrado nessas figuras - corresponde a uma mudança relativamente grande na posição horizontal da mediana. De fato, como a área subtendida por uma pequena seção horizontal da caixa é proporcional à altura , as alterações nas medianas são divididas pela altura da caixa. Isso faz com que a mediana seja mais variável para esta caixa do que para a caixa quadrada, porque esta é muito mais baixa no meio.
Em resumo, quando medimos a posição da mediana em termos de área (à esquerda e à direita), a análise original (para uma caixa quadrada) permanece inalterada. A forma da caixa só complica a distribuição se insistirmos em medir a mediana em termos de sua posição horizontal. Quando fazemos isso, a relação entre a representação da área e da posição é inversamente proporcional à altura da caixa.
Há mais a aprender com essas fotos. É claro que, quando poucos átomos estão na (ou) caixa, há uma chance maior de que metade deles possa acidentalmente terminar agrupada em ambos os lados. À medida que o número de átomos aumenta, o potencial para um desequilíbrio extremo diminui. Para acompanhar isso, peguei "filmes" - uma longa série de 5000 quadros - para a caixa curva preenchida com , depois com , depois e, finalmente, com átomos, e observei as medianas. Aqui estão os histogramas das posições medianas:15 75 37531575375
Claramente, para um número suficientemente grande de átomos, a distribuição de sua posição mediana começa a parecer em forma de sino e fica mais estreita: isso parece um resultado do Teorema do Limite Central, não é?
Resultados Quantitativos
A "caixa", é claro, descreve a densidade de probabilidade de alguma distribuição: seu topo é o gráfico da função de densidade (PDF). Assim, as áreas representam probabilidades. Colocar pontos aleatoriamente e independentemente dentro de uma caixa e observar suas posições horizontais é uma maneira de extrair uma amostra da distribuição. (Essa é a ideia por trás da amostragem por rejeição. )n
A próxima figura conecta essas idéias.
Isso parece complicado, mas é realmente muito simples. Existem quatro gráficos relacionados aqui:
O gráfico superior mostra o PDF de uma distribuição junto com uma amostra aleatória do tamanho . Valores maiores que a mediana são mostrados como pontos brancos; valores menores que a mediana como pontos pretos. Não precisa de uma escala vertical, porque sabemos que a área total é a unidade.n
O gráfico do meio é a função de distribuição cumulativa para a mesma distribuição: usa altura para denotar probabilidade. Ele compartilha seu eixo horizontal com o primeiro gráfico. Seu eixo vertical deve ir de a porque representa probabilidades.101
O gráfico da esquerda deve ser lido de lado: é o PDF da distribuição Beta . Ele mostra como a mediana na caixa variará quando a mediana for medida em termos de áreas à esquerda e à direita do meio (em vez de ser medida por sua posição horizontal). Eu desenhei pontos aleatórios deste PDF, como mostrado, e os conectei com linhas tracejadas horizontais aos locais correspondentes no CDF original: é assim que os volumes (medidos à esquerda) são convertidos em posições (medidas na parte superior, central) e gráficos inferiores). Um desses pontos realmente corresponde à mediana mostrada no gráfico superior; Eu desenhei uma linha vertical sólida para mostrar isso.16(n/2+1,n/2+1)16
O gráfico de fundo é a densidade amostral da mediana, medida pela sua posição horizontal. É obtido convertendo a área (na plotagem esquerda) para a posição. A fórmula de conversão é dada pelo inverso do CDF original: esta é simplesmente a definição do CDF inverso! (Em outras palavras, o CDF converte a posição em área à esquerda; o CDF inverso converte de volta da área para a posição.) Plotamos linhas verticais tracejadas, mostrando como os pontos aleatórios do gráfico esquerdo são convertidos em pontos aleatórios no gráfico inferior . Esse processo de leitura transversal e descendente nos diz como ir de uma área para outra.
Seja o CDF da distribuição original (plot do meio) e o CDF da distribuição Beta. Para encontrar a chance de a mediana estar à esquerda de alguma posição , primeiro use para obter a área à esquerda de na caixa: este é o próprio . A distribuição Beta à esquerda nos diz que há metade dos átomos nesse volume, dando : esse é o CDF da posição mediana . Para encontrar seu PDF (como mostrado na plotagem inferior), use a derivada:FGxFxF(x)G(F(x))
ddxG(F(x))=G′(F(x))F′(x)=g(F(x))f(x)
onde é o PDF (plotagem superior) é o PDF beta (plotada esquerda).fg
Essa é uma fórmula exata para a distribuição da mediana para qualquer distribuição contínua. (Com algum cuidado na interpretação, pode ser aplicado a qualquer distribuição, seja contínua ou não.)
Resultados Assintóticos
Quando é muito grande e não tem um salto em sua mediana, a mediana da amostra deve variar bastante em torno da verdadeira mediana da distribuição. Supondo também que o PDF seja contínuo próximo a , na fórmula anterior não mudará muito de seu valor em fornecido por Além disso, também não mudará muito de seu valor: para primeira ordem,nFμfμ f(x)μ,f(μ).F
F(x)=F(μ+(x−μ))≈F(μ)+F′(μ)(x−μ)=1/2+f(μ)(x−μ).
Assim, com uma aproximação cada vez melhor à medida que cresce,n
g(F(x))f(x)≈g(1/2+f(μ)(x−μ))f(μ).
Isso é apenas uma mudança de localização e escala da distribuição Beta. O redimensionamento por dividirá sua variação por (que é melhor ser diferente de zero!). Aliás, a variação de Beta é muito próxima de .f(μ)f(μ)2(n/2+1,n/2+1)n/4
Esta análise pode ser vista como uma aplicação do método Delta .
Finalmente, Beta é aproximadamente Normal para grande . Existem muitas maneiras de ver isso; talvez o mais simples seja analisar o logaritmo de seu PDF próximo a :(n/2+1,n/2+1)n1/2
log(C(1/2+x)n/2(1/2−x)n/2)=n2log(1−4x2)+C′=C′−2nx2+O(x4).
(As constantes e apenas normalizam a área total para a unidade.) Por meio da terceira ordem em então, é o mesmo que o log do PDF normal com variação (Este argumento é rigoroso usando funções geradoras de características ou cumulantes, em vez do log do PDF.)CC′x,1/(4n).
Juntando isso, concluímos que
A distribuição da mediana da amostra varia aproximadamente ,1/(4nf(μ)2)
e é aproximadamente normal para grande ,n
tudo desde que o PDF seja contínuo e diferente de zero na medianafμ.