Para que distribuição é uma média aparada, o estimador de probabilidade máxima?

8

A média da amostra é o estimador de probabilidade máxima de para uma distribuição normal . A mediana da amostra é o estimador de probabilidade máxima de para uma distribuição de Laplace (também chamada de distribuição exponencial dupla). $\mu$ $\text{Normal}(\mu,\sigma)$ $m$ $\text{Laplace}(m,s)$

Existe uma distribuição com um parâmetro de localização para o qual a média aparada da amostra é o estimador de probabilidade máxima?

distributions maximum-likelihood trimmed-mean

— Rasmus Bååth
fonte

9

As distribuições, se houver, são obtidas como integrais das equações de estimativa. Vamos assumir por simplicidade que o parâmetro de escala é conhecido e os parâmetros de corte, se houver, são fixos.

Para a média da amostra, a equação de estimativa éImaginando que essa é a derivada da probabilidade logarítmica, com muito abuso de notação e perda de rigor, temos onde a parâmetro (constante de integração) tem de ser negativo para garantir que ele se integra para algo significativo. $E (x - μ) = 0.$ ${\rm E}(x-\mu)=0.$ $\frac{d \ln l (μ; x)}{d μ} = x - μ, \ln l (μ; x) = a (x - μ)^{2}, l (μ; x) \propto \exp [a (x - μ)^{2}],$ $\frac{{\rm d}\ln l(\mu;x)}{{\rm d}\mu} = x-\mu, \quad \ln l(\mu;x) = a (x-\mu)^2, \quad l(\mu;x) \propto \exp[ a(x-\mu)^2],$ $a$
Para a mediana da amostra, a equação de estimativa éIntegre isso para obter onde novamente teríamos que escolher para ser negativo para fazer sentido. $E s i g n (x - μ) = 0.$ ${\rm E \, sign}(x-\mu)=0.$ $l (μ; x) \propto \exp [a | x - μ |],$ $l(\mu;x) \propto \exp[ a|x-\mu| ],$ $a$
Para a média aparada, a equação de estimativa éVamos ver o que ele integra:Parece um normal censurado no centro, mas veja as caudas: elas são impróprias se . Portanto, para obter uma distribuição adequada, precisamos definir . Mas então temos uma inconsistência lógica: essa distribuição teria que dar um zero de pdf para alguns dados reais nas caudas aparadas. Isso é auto-contraditório e mostra alguns efeitos colaterais indesejáveis do corte. $E ρ (x, μ, c) = 0, ρ (x, μ, c) = {\begin{cases} x - μ, & | x - μ | \leq c, \\ 0, & | x - μ | > c . \end{cases}$ ${\rm E}\rho(x,\mu,c) = 0, \quad \rho(x,\mu,c) = \left\{ \begin{array}{ll} x-\mu, & |x-\mu|\le c, \\ 0, & |x-\mu|>c. \end{array} \right.$ $l (μ; x, c) = {\begin{cases} \exp [a (x - μ)^{2}], & | x - μ | \leq c, \\ b, & | x - μ | > c . \end{cases}$ $l(\mu;x, c) = \left\{ \begin{array}{ll} \exp[ a(x-\mu)^2], & |x-\mu|\le c, \\ b, & |x-\mu|>c. \end{array} \right.$ $b>0$ $b=0$

Às vezes, é benéfico estabelecer a "probabilidade" de um método para mostrar sua normalidade assintótica e eficiência para uma classe restrita de distribuições. Em geral, a normalidade assintótica da média aparada pode seguir a partir da teoria dos valores- . $M$

— StasK
fonte

1

Essa é realmente a equação de estimativa de uma média aparada? Em sua equação parece ser uma constante que "devoluções" de dados que está longe o tempo médio na versão normal de uma média aparada a definir qual a proporção dos pontos de dados devem ser descartados a partir das caudas dos dados. Não são essas duas coisas diferentes ou estou faltando alguma coisa?

c

$c$

c

$c$

— Rasmus Bååth

Sim, é realmente um pouco diferente - eu disse que estou tratando a constante de corte como fixa. Torná-lo dependente de dados complicará as coisas, mas acredito que levaria à conclusão similar de que alguns dos pontos de dados são "impossíveis" sob a distribuição implícita na "probabilidade".

— StasK

4

Casos especiais, como a mediana à parte, não acho que os meios aparados sejam geralmente ML; se fossem, já seriam uma forma de estimador-M. No entanto, se você usar uma distribuição que é normal no meio com, digamos, caudas exponenciais - a distribuição correspondente a um estimador Huber M -, para um nível específico de corte, espera-se que a média aparada seja altamente eficiente.

— Glen_b -Reinstate Monica
fonte