Quando usar a mediana da amostra como estimador para a mediana de uma distribuição lognormal?

Eu próprio sempre usaria a média geométrica para estimar uma mediana lognormal. No entanto, no mundo da indústria, algumas vezes o uso da mediana da amostra fornece melhores resultados. A questão, portanto, é: existe um intervalo / ponto de corte a partir do qual a mediana da amostra possa ser usada com confiabilidade como estimador da mediana da população?

Além disso, a média geométrica da amostra é MLE para mediana, mas não imparcial. Um estimador imparcial seria se for conhecido. Na prática, um estimador corrigido tendencioso (veja abaixo) é usado, pois é sempre desconhecido. Existem documentos dizendo que esse estimador geomeano corrigido por viés é melhor por causa de menor MSE e imparcialidade. No entanto, na realidade, quando temos apenas um tamanho de amostra de 4 a 6, posso argumentar que a correção do viés não faz sentido, pois $\hat{\beta}_{\mbox{CGM0}}=\exp(\hat{\mu}-\sigma^2/2N)$ $\sigma$ $\hat{\beta}_{\mbox{CGM}}$ $\sigma$

Imparcialidade significa que o estimador está centrado em torno do parâmetro verdadeiro da população, nem subestima ou superestima o parâmetro. Para uma distribuição positivamente inclinada, o centro é a mediana e não a média.
Invariável à transformação é uma propriedade importante na minha área atual (transformação entre DT50 e taxa de degradação k, k = log (2) / DT50). Você obterá resultados diferentes com base nos dados originais e nos dados transformados.
Para um tamanho de amostra limitado, a imparcialidade média é potencialmente enganosa. Viés não é erro, um estimador imparcial pode dar um erro maior. Do ponto de vista bayesiano, os dados são conhecidos e fixos, o MLE maximiza a probabilidade de observação dos dados, enquanto a correção de viés é baseada em parâmetros fixos.

O estimador da média geométrica da amostra é MLE, isento de mediana, invariável a transformações. Eu acho que deveria ser preferido ao estimador geomeano corrigido pela polarização. Estou certo?

Supondo que $X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2)$

$\beta = \exp(\mu)$

$\hat{\beta}_{\mbox{GM}}= \exp(\hat{\mu})= \exp{(\sum\frac{\log(X_i)}{N})} \sim \mbox{LN}(\mu,\sigma^2/N)$

$\hat{\beta}_{\mbox{SM}}= \mbox{median}(X_1,X_2,...,X_N)$

$\hat{\beta}_{\mbox{CGM}}= \exp(\hat{\mu}-\hat\sigma^2/2N)$

onde e são os log-mean e log-sd, e são os MLEs para e . $\mu$ $\sigma$ $\hat\mu$ $\hat\sigma$ $\mu$ $\sigma$

Uma questão relacionada: para a variância da mediana da amostra, existe uma fórmula aproximada ; o que é um tamanho de amostra grande o suficiente para usar esta fórmula? $\frac{1}{4Nf(m)^2}$

median unbiased-estimator lognormal

— Zhenglei
fonte

Sua expressão para não tem um chapéu no . Isso significa que assume que é conhecido? Isso parece torná-lo não muito útil.

{\hat{β}}_{CGM}

$\hat{\beta}_{\mbox{CGM}}$

σ^{2}

$\sigma^2$

σ^{2}

$\sigma^2$

— Hong Ooi 17/07/2013

desculpe, deve ser

{\hat{σ}}^{2}

$\hat\sigma^2$

— Zhenglei

Não está claro quais são seus estimadores porque você não definiu ou . A principal preocupação sobre modelos lognormal e amostras pequenas é que os estimadores baseados em lognormal são sensíveis à suposição lognormal, portanto, a menos que você tenha boas evidências de que essa suposição esteja correta, geralmente é melhor usar estimadores robustos alternativos.

\hat{μ}

$\hat{\mu}$

\hat{σ}

$\hat{\sigma}$

— whuber

@whuber, e são os MLEs. Eu concordo com a preocupação da suposição lognormal. Na minha área de trabalho atual, a suposição lognormal é uma prática padrão e é aceita pelas autoridades. Então, todas as minhas perguntas são baseadas na suposição lognormal sendo correta.

\hat{μ}

$\hat\mu$

\hat{σ}

$\hat\sigma$

— Zhenglei 17/07/2013

não, o e o são a média do log e o log-sd, não a média e o sd do lognormal. Vou editar a pergunta para esclarecer.

μ

$\mu$

σ

$\sigma$

— Zhenglei 17/07/2013

Aparentemente, o conceito de imparcialidade já foi discutido há muito tempo. Eu sinto que é um tópico digno de discussão, já que a imparcialidade média é um requisito padrão para um bom estimador, mas para amostras pequenas, isso não significa tanto quanto em estimativas de amostras grandes.

Postei essas duas referências como resposta à minha segunda pergunta no post.

Brown, George W. "Na estimativa de pequenas amostras". Os Anais de Estatística Matemática, vol. 18, n. 4 (dezembro de 1947), pp. 582–585. JSTOR 2236236.

Lehmann, EL "Um conceito geral de imparcialidade" The Annals of Mathematics Statistics, vol. 22, n. 4 (dezembro de 1951), pp. 587–592. JSTOR 2236928

— Zhenglei
fonte