A mediana da amostra é uma estatística de ordem e tem uma distribuição não normal; portanto, a distribuição de amostra finita conjunta da mediana da amostra e da média da amostra (que tem uma distribuição normal) não seria normal bivariada. Recorrendo a aproximações, assintoticamente o seguinte vale (veja minha resposta aqui ):
√n[(ˉXnYn)−(μv)]→LN[(00),Σ]
n−−√[(X¯nYn)−(μv)]→LN[(00),Σ]
com
Σ=(σ2E(|X−v|)[2f(v)]−1E(|X−v|)[2f(v)]−1[2f(v)]−2)
Σ=(σ2E(|X−v|)[2f(v)]−1E(|X−v|)[2f(v)]−1[2f(v)]−2)
onde é a média da amostra e a média da população, é a mediana da amostra e a mediana da população, é a densidade de probabilidade das variáveis aleatórias envolvidas e é a variância. ˉXnX¯nμμYnYnvvf()f()σ2σ2
Então, aproximadamente, para amostras grandes, sua distribuição conjunta é normal bivariada, então temos que
E(Yn∣ˉXn=ˉx)=v+ρσvσˉX(ˉx−μ)
E(Yn∣X¯n=x¯)=v+ρσvσX¯(x¯−μ)
onde é o coeficiente de correlação.ρρ
Manipulando a distribuição assintótica para se tornar a distribuição conjunta de amostra grande aproximada da média e mediana da amostra (e não das quantidades padronizadas), temos
ρ=1nE(|X−v|)[2f(v)]−11nσ[2f(v)]−1=E(|X−v|)σ
ρ=1nE(|X−v|)[2f(v)]−11nσ[2f(v)]−1=E(|X−v|)σ
Então,
E(Yn∣ˉXn=ˉx)=v+E(|X−v|)σ[2f(v)]−1σ(ˉx−μ)
E(Yn∣X¯n=x¯)=v+E(|X−v|)σ[2f(v)]−1σ(x¯−μ)
Temos que devido à simetria da densidade normal, então chegamos a2f(v)=2/σ√2π2f(v)=2/σ2π−−√
E(Yn∣ˉXn=ˉx)=v+√π2E(|X−μσ|)(ˉx−μ)
E(Yn∣X¯n=x¯)=v+π2−−√E(∣∣∣X−μσ∣∣∣)(x¯−μ)
onde usamos . Agora, a variável padronizada é um normal padrão, portanto, seu valor absoluto é uma distribuição semi-normal com valor esperado igual a (uma vez que a variação subjacente é unidade). entãov=μv=μ√2/π2/π−−−√
E(Yn∣ˉXn=ˉx)=v+√π2√2π(ˉx−μ)=v+ˉx−μ=ˉx
E(Yn∣X¯n=x¯)=v+π2−−√2π−−√(x¯−μ)=v+x¯−μ=x¯