Por que o desvio padrão da amostra é um estimador enviesado de


57

De acordo com o artigo da Wikipedia sobre estimativa imparcial do desvio padrão, a amostra DP

s=1 1n-1 1Eu=1 1n(xEu-x¯)2

é um estimador tendencioso do DP da população. Ele afirma que E(s2)E(s2) .

NB Variáveis ​​aleatórias são independentes e cada xiN(μ,σ2)

Minha pergunta é dupla:

  • Qual é a prova da parcialidade?
  • Como calcular a expectativa do desvio padrão da amostra

Meu conhecimento de matemática / estatística é apenas intermediário.


4
Você encontrará as duas perguntas respondidas no artigo da Wikipedia sobre a distribuição do Chi .
whuber

Respostas:


57

A resposta da @ NRH a esta pergunta fornece uma prova simples e agradável da parcialidade do desvio padrão da amostra. Aqui vou calcular explicitamente a expectativa do desvio padrão da amostra (a segunda pergunta do pôster original) de uma amostra normalmente distribuída, momento em que o viés é claro.

A variância da amostra imparcial de um conjunto de pontos éx1,...,xn

s2=1n1i=1n(xix¯)2

Se o 's são distribuídos normalmente, é um facto quexi

(n1)s2σ2χn12

onde é a verdadeira variação. A distribuição χ 2 k tem densidade de probabilidadeσ2χk2

p(x)=(1/2)k/2Γ(k/2)xk/21ex/2

usando isso, podemos derivar o valor esperado de ;s

E(s)=σ2n1E(s2(n1)σ2)=σ2n10x(1/2)(n1)/2Γ((n1)/2)x((n1)/2)1ex/2 dx

que decorre da definição do valor esperado e do fato de que é a raiz quadrada de umavariável distribuídaχ2. O truque agora é reorganizar os termos para que o integrando se torne outradensidadeχ2:s2(n1)σ2χ2χ2

E(s)=σ2n-1 10 0(1 1/2)(n-1 1)/2Γ(n-1 12)x(n/2)-1 1e-x/2 dx=σ2n-1 1Γ(n/2)Γ(n-1 12)0 0(1 1/2)(n-1 1)/2Γ(n/2)x(n/2)-1 1e-x/2 dx=σ2n-1 1Γ(n/2)Γ(n-1 12)(1 1/2)(n-1 1)/2(1 1/2)n/20 0(1 1/2)n/2Γ(n/2)x(n/2)-1 1e-x/2 dxχn2 densEuty

agora conhecemos o integrando que a última linha é igual a 1, pois é uma densidade . Simplificar um pouco as constantes fornece χn2

E(s)=σ2n-1 1Γ(n/2)Γ(n-1 12)

Portanto, o viés de és

σ-E(s)=σ(1 1-2n-1 1Γ(n/2)Γ(n-1 12))σ4n
como .n

Não é difícil ver que esse viés não é 0 para qualquer finito , provando assim que o desvio padrão da amostra é tendencioso. Abaixo da polarização é trama como uma função de n para σ = 1 em vermelho, juntamente com 1 / 4 N em azul:nnσ=1 11 1/4n

insira a descrição da imagem aqui


(4n)-1 1

Você realmente se esforçou muito para fazer essa macro. Quando vi o post pela primeira vez, cerca de um minuto atrás, eu estava pensando em mostrar o viés usando a regra de Jensen, mas alguém já o fez.
Michael Chernick 8/12/12

2
é claro que essa é uma maneira completa de mostrar que o desvio padrão é tendencioso - eu estava respondendo principalmente à segunda pergunta do pôster original: "Como alguém calcula a expectativa do desvio padrão?".
Macro

2
sσk

2
skk

43

s2=1 1n-1 1Eu=1 1n(xEu-x¯)2
σ2
E(s2)<E(s2)=σ
s2σ2

19

Sn=Eu=1 1n(XEu-X¯n)2n-1 1,
SnVumar[Sn]0 0
0 0<Vumar[Sn]=E[Sn2]-E2[Sn]E2[Sn]<E[Sn2]E[Sn]<E[Sn2]=σ.
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.