Estimadores de probabilidade máxima para uma distribuição truncada


28

Considere amostras independentes S obtidas de uma variável aleatória X que se supõe seguir uma distribuição truncada (por exemplo, uma distribuição normal truncada ) de valores mínimos e máximos conhecidos (finitos) a e b, mas com parâmetros desconhecidos μ e σ 2 . Se X seguido uma distribuição não-truncada, os estimadores da probabilidade máxima u e σ 2 para μ e σ 2 de S seria a média da amostra μNSXabμσ2Xμ^σ^2μσ2Se a variância da amostra σ 2=1μ^=1NiSi. Entretanto, para uma distribuição truncada, a variação da amostra definida dessa maneira é delimitada por(b-a)2,portanto nem sempre é um estimador consistente: paraσ2>(b-a)2, não pode convergir em probabilidade paraσ2comoNvai para o infinito. Assim, parece que μ e σ 2não são os estimadores de máxima probabilidade deμσ^2=1Ni(Siμ^)2(ba)2σ2>(ba)2σ2Nμ^σ^2μe para uma distribuição truncada. Obviamente, isso é esperado, já que os parâmetros μ e σ 2 de uma distribuição normal truncada não são sua média e variância.σ2μσ2

Então, quais são os estimadores de máxima verossimilhança dos parâmetros e σ de uma distribuição truncada de valores mínimos e máximos conhecidos?μσ


Você tem certeza da sua análise? Eu acho que você está fazendo uma suposição inválida: para a situação truncada, o LEM de não é mais a variação da amostra (e, em geral, o LEM de μ não é mais a média da amostra)! σ2μ
whuber

whuber: Eu sei, esta é precisamente a minha pergunta: quais são os MLEs de e μ no caso truncado? Adicionando uma frase para insistir nisso. σ2μ
a3nm

1
Não há uma solução de formulário fechado. Tudo o que você pode fazer é minimizar numericamente a probabilidade do log. Mas isso não é qualitativamente diferente de muitos outros modelos, como a regressão logística, que também não possui solução de forma fechada.
whuber

whuber: Se isso é verdade, isso é bastante decepcionante. Você tem referências sobre a falta de soluções de formulário fechado? Existem estimadores de formato fechado que não têm probabilidade máxima, mas são pelo menos consistentes (e opcionalmente imparciais?).
a3nm

1
@ whuber: Você pode pelo menos simplificar suas amostras em estatísticas suficientes para que a minimização seja rápida?
Neil G

Respostas:


29

Considere qualquer família em escala de localização determinada por uma distribuição "padrão" ,F

ΩF={F(μ,σ):xF(xμσ)σ>0}.

Supondo que diferenciável, descobrimos facilmente que os PDFs são 1F.1σf((xμ)/σ)dx

Truncando estas distribuições para restringir o seu apoio entre e b , uma < b , meios que os PDF são substituídos pelosaba<b

f(μ,σ;a,b)(x)=f(xμσ)dxσC(μ,σ,a,b),axb

xC(μ,σ,a,b)=F(μ,σ)(b)F(μ,σ)(a)f(μ,σ;a,b)C1xi

Λ(μ,σ)=i[logf(xiμσ)logσlogC(μ,σ,a,b)].

σ=0

0=Λμ=i[fμ(xiμσ)f(xiμσ)Cμ(μ,σ,a,b)C(μ,σ,a,b)]0=Λσ=i[fσ(xiμσ)σ2f(xiμσ)1σCσ(μ,σ,a,b)C(μ,σ,a,b)]

abnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)

A(μ,σ)=ifμ(xiμσ)f(xiμσ)σ2B(μ,σ)nσ=ifσ(xiμσ)f(xiμσ)

Comparando-os com a situação de não truncamento, é evidente que

  • Quaisquer estatísticas suficientes para o problema original são suficientes para o problema truncado (porque o lado direito não foi alterado).

  • ABμσ

C(μ,σ,a,b)


fμfσCμCσx[a,b]

1
Cμ=μC(μ,σ,a,b)

Além disso, como sua resposta é mais geral do que a esperada, editei minha pergunta para insistir menos no caso de distribuições normais. Mais uma vez obrigado pelo seu esforço.
a3nm

1
Era mais fácil explicar nesse nível de generalidade em comparação com o foco nas distribuições normais! Computar as derivadas e mostrar a forma precisa do CDF são distrações desnecessárias (embora úteis quando você começa a codificar a solução numérica).
whuber

1
Obrigado por corrigir! Você perdeu um deles; você poderia revisar minha edição?
a3nm
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.