Quando usar a mediana da amostra como estimador para a mediana de uma distribuição lognormal?


8

Eu próprio sempre usaria a média geométrica para estimar uma mediana lognormal. No entanto, no mundo da indústria, algumas vezes o uso da mediana da amostra fornece melhores resultados. A questão, portanto, é: existe um intervalo / ponto de corte a partir do qual a mediana da amostra possa ser usada com confiabilidade como estimador da mediana da população?

Além disso, a média geométrica da amostra é MLE para mediana, mas não imparcial. Um estimador imparcial seria se for conhecido. Na prática, um estimador corrigido tendencioso (veja abaixo) é usado, pois é sempre desconhecido. Existem documentos dizendo que esse estimador geomeano corrigido por viés é melhor por causa de menor MSE e imparcialidade. No entanto, na realidade, quando temos apenas um tamanho de amostra de 4 a 6, posso argumentar que a correção do viés não faz sentido, poisσ β CGMσβ^CGM0=exp(μ^-σ2/2N)σβ^CGMσ

  1. Imparcialidade significa que o estimador está centrado em torno do parâmetro verdadeiro da população, nem subestima ou superestima o parâmetro. Para uma distribuição positivamente inclinada, o centro é a mediana e não a média.
  2. Invariável à transformação é uma propriedade importante na minha área atual (transformação entre DT50 e taxa de degradação k, k = log (2) / DT50). Você obterá resultados diferentes com base nos dados originais e nos dados transformados.
  3. Para um tamanho de amostra limitado, a imparcialidade média é potencialmente enganosa. Viés não é erro, um estimador imparcial pode dar um erro maior. Do ponto de vista bayesiano, os dados são conhecidos e fixos, o MLE maximiza a probabilidade de observação dos dados, enquanto a correção de viés é baseada em parâmetros fixos.

O estimador da média geométrica da amostra é MLE, isento de mediana, invariável a transformações. Eu acho que deveria ser preferido ao estimador geomeano corrigido pela polarização. Estou certo?

Supondo queX1,X2,...,XNLN(μ,σ2)

β=exp(μ)

β^GM=exp(μ^)=exp(registro(XEu)N)LN(μ,σ2/N)

β^SM=mediana(X1,X2,...,XN)

β^CGM=exp(μ^-σ^2/2N)

onde e são os log-mean e log-sd, e são os MLEs para e .σ u σ u σμσμ^σ^μσ

Uma questão relacionada: para a variância da mediana da amostra, existe uma fórmula aproximada ; o que é um tamanho de amostra grande o suficiente para usar esta fórmula?14Nf(m)2


Sua expressão para não tem um chapéu no . Isso significa que assume que é conhecido? Isso parece torná-lo não muito útil. σ2σ2β^CGMσ2σ2
Hong Ooi 17/07/2013

desculpe, deve serσ^2
Zhenglei

2
Não está claro quais são seus estimadores porque você não definiu ou . A principal preocupação sobre modelos lognormal e amostras pequenas é que os estimadores baseados em lognormal são sensíveis à suposição lognormal, portanto, a menos que você tenha boas evidências de que essa suposição esteja correta, geralmente é melhor usar estimadores robustos alternativos. μ^σ^
whuber

@whuber, e são os MLEs. Eu concordo com a preocupação da suposição lognormal. Na minha área de trabalho atual, a suposição lognormal é uma prática padrão e é aceita pelas autoridades. Então, todas as minhas perguntas são baseadas na suposição lognormal sendo correta. μ^σ^
Zhenglei 17/07/2013

2
não, o e o são a média do log e o log-sd, não a média e o sd do lognormal. Vou editar a pergunta para esclarecer. μσ
Zhenglei 17/07/2013

Respostas:


3

Aparentemente, o conceito de imparcialidade já foi discutido há muito tempo. Eu sinto que é um tópico digno de discussão, já que a imparcialidade média é um requisito padrão para um bom estimador, mas para amostras pequenas, isso não significa tanto quanto em estimativas de amostras grandes.

Postei essas duas referências como resposta à minha segunda pergunta no post.

Brown, George W. "Na estimativa de pequenas amostras". Os Anais de Estatística Matemática, vol. 18, n. 4 (dezembro de 1947), pp. 582–585. JSTOR 2236236.

Lehmann, EL "Um conceito geral de imparcialidade" The Annals of Mathematics Statistics, vol. 22, n. 4 (dezembro de 1951), pp. 587–592. JSTOR 2236928

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.