A observação de que, em um exemplo envolvendo dados extraídos de uma distribuição Gaussiana contaminada, você obteria melhores estimativas dos parâmetros que descrevem a maior parte dos dados usando os dados vez de med | x - med ( x ) | onde mad ( x ) é:madmed|x−med(x)|mad(x)
mad=1.4826×med|x−med(x)|
--where, é um fator de consistência projetado para garantir que E ( mad ( x ) 2 ) = Var ( x )
quando x não é contaminado-- foi originalmente produzido por Gauss (Walker H. (1931)).(Φ−1(0.75))−1=1.4826
E(mad(x)2)=Var(x)
x
Não consigo pensar em nenhum motivo para não usar o vez da média da amostra nesse caso. A menor eficiência (no gaussiano!) Dos loucos pode ser uma razão para não usar os loucos no seu exemplo. No entanto, existem alternativas igualmente robustas e altamente eficientes para os loucos . Um deles é o Q nmedmadmadmadQn. Este estimador tem muitas outras vantagens ao lado. Também é muito insensível aos discrepantes (na verdade quase tão insensíveis quanto os loucos). Ao contrário do louco, ele não é construído em torno de uma estimativa de localização e não assume que a distribuição da parte não contaminada dos dados seja simétrica. Como o louco, é baseado em estatísticas de pedidos, para que seja sempre bem definido, mesmo quando a distribuição subjacente da sua amostra não tiver momentos. Como os loucos, tem uma forma explícita simples. Ainda mais do que para os loucos, não vejo motivos para usar o desvio padrão da amostra em vez do no exemplo que você descreve (consulte Rousseeuw e Croux 1993 para obter mais informações sobre o Q n ).QnQn
Quanto à sua última pergunta, sobre o caso específico em que , entãox∼Γ(ν,λ)
med(x)≈λ(ν−1/3)
e
mad(x)≈λν−−√
(em ambos os casos, as aproximações se tornam boas quando ) para que ν>1.5
ν^=(med(x)mad(x))2
e
λ^=mad(x)2med(x)
Veja Chen e Rubin (1986) para uma derivação completa.
- J. Chen e H. Rubin, 1986. Limites para a diferença entre mediana e média das distribuições Gamma e Poisson, Statist. Probab. Lett., 4, 281-283.
- PJ Rousseeuw e C. Croux, 1993. Alternativas ao Median Absolute Deviation Journal da American Statistical Association, vol. 88, n. 424, pp. 1273-1283
- Walker, H. (1931). Estudos de História do Método Estatístico. Baltimore, MD: Williams & Wilkins Co., pp. 24–25.