Eu próprio sempre usaria a média geométrica para estimar uma mediana lognormal. No entanto, no mundo da indústria, algumas vezes o uso da mediana da amostra fornece melhores resultados. A questão, portanto, é: existe um intervalo / ponto de corte a partir do qual a mediana da amostra possa ser usada com confiabilidade como estimador da mediana da população?
Além disso, a média geométrica da amostra é MLE para mediana, mas não imparcial. Um estimador imparcial seria se for conhecido. Na prática, um estimador corrigido tendencioso (veja abaixo) é usado, pois é sempre desconhecido. Existem documentos dizendo que esse estimador geomeano corrigido por viés é melhor por causa de menor MSE e imparcialidade. No entanto, na realidade, quando temos apenas um tamanho de amostra de 4 a 6, posso argumentar que a correção do viés não faz sentido, poisσ β CGMσ
- Imparcialidade significa que o estimador está centrado em torno do parâmetro verdadeiro da população, nem subestima ou superestima o parâmetro. Para uma distribuição positivamente inclinada, o centro é a mediana e não a média.
- Invariável à transformação é uma propriedade importante na minha área atual (transformação entre DT50 e taxa de degradação k, k = log (2) / DT50). Você obterá resultados diferentes com base nos dados originais e nos dados transformados.
- Para um tamanho de amostra limitado, a imparcialidade média é potencialmente enganosa. Viés não é erro, um estimador imparcial pode dar um erro maior. Do ponto de vista bayesiano, os dados são conhecidos e fixos, o MLE maximiza a probabilidade de observação dos dados, enquanto a correção de viés é baseada em parâmetros fixos.
O estimador da média geométrica da amostra é MLE, isento de mediana, invariável a transformações. Eu acho que deveria ser preferido ao estimador geomeano corrigido pela polarização. Estou certo?
Supondo que
onde e são os log-mean e log-sd, e são os MLEs para e .σ u σ u σ
Uma questão relacionada: para a variância da mediana da amostra, existe uma fórmula aproximada ; o que é um tamanho de amostra grande o suficiente para usar esta fórmula?