Regressão linear: alguma distribuição não normal que dê identidade ao OLS e MLE?


13

Esta questão é inspirada na longa discussão nos comentários aqui: Como a regressão linear usa a distribuição normal?

No modelo de regressão linear usual, por simplicidade, aqui escrito com apenas um preditor:

Yi=β0+β1xi+ϵi
onde são constantes conhecidas e são termos de erro independentes com média zero. Se, além disso, assumirmos distribuições normais para os erros, os estimadores usuais de mínimos quadrados e os estimadores de probabilidade máxima de serão idênticos.ϵ i β 0 , β 1xiϵiβ0,β1

Portanto, minha pergunta fácil: existe alguma outra distribuição para os termos de erro, de modo que a mle seja idêntica ao estimador ordinário de mínimos quadrados? A implicação é fácil de mostrar, a outra não.


1
(+1) Teria de ser uma distribuição centrada em torno de zero e, ao que parece, ajudaria se fosse simétrica. Alguns candidatos que vêm à mente, como a distribuição t- ou Laplace, não parecem fazer o truque, pois o MLE é, mesmo no constante caso único, não disponível de forma fechada ou fornecida pela mediana, respectivamente.
Christoph Hanck

ver também stats.stackexchange.com/questions/99014/... , parece que há somente tanto para encontrar
Christoph Hanck

Tenho certeza que a resposta é não. No entanto, pode ser difícil escrever uma prova rigorosa.
Gordon Smyth

Respostas:


11

Na estimativa da máxima verossimilhança, calculamos

β^ML:lnf(ϵi)β=0f(ϵi)f(ϵi)xi=0

a última relação levando em consideração a estrutura de linearidade da equação de regressão.

Em comparação, o estimador OLS satisfaz

ϵixi=0

Para obter expressões algébricas idênticas para os coeficientes de declive, precisamos ter uma densidade para o termo de erro tal que

f(ϵi)f(ϵi)=±cϵif(ϵi)=±cϵif(ϵi)

Estas são equações diferenciais da forma que têm soluçõesy=±xy

1ydy=±xdxlny=±12x2

y=f(ϵ)=exp{±12cϵ2}

Qualquer função que possua esse kernel e se integre à unidade em um domínio apropriado fará com que o MLE e o OLS dos coeficientes de inclinação sejam idênticos. Ou seja, estamos procurando

g(x)=Aexp{±12cx2}:abg(x)dx=1

g

Certamente. Mas mais uma coisa que devemos considerar é o seguinte: se alguém usar o sinal de mais no expoente e um suporte simétrico em torno de zero, por exemplo, obterá uma densidade que tenha um mínimo exclusivo no meio e dois máximos locais em os limites do apoio.


Ótima resposta (+1), mas se alguém usa um sinal de mais na função, é mesmo uma densidade? Parece então que a função possui uma infinita integral e, portanto, não pode ser normalizada para uma função de densidade. Se for esse o caso, ficamos apenas com a distribuição normal.
Reintegrar Monica

1
(a,b)

Isso é verdade - eu estava assumindo isso.
Reintegrar Monica

5

argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)
argβ0,β1mini=1nlog{f(yi|xi,β0,β1)}=argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)=f0(y|x)exp{ω(yiβ0β1xi)2}
f0(y|x)(β0,β1)

y

h(||yXβ||)
h()ϵi

1
Isso não parece correto para mim. Se você usar uma distribuição esférica simétrica diferente, isso não levaria à minimização de uma função diferente da norma que a do quadrado (portanto, não sendo a estimativa dos mínimos quadrados)?
Reintegrar Monica

1

Eu não sabia sobre essa pergunta até @ Xi'an apenas atualizar com uma resposta. Existe uma solução mais genérica. As distribuições exponenciais da família com alguns parâmetros fixaram o rendimento para as divergências de Bregman. Para essas distribuições, a média é o minimizador. O minimizador de OLS também é a média. Portanto, para todas essas distribuições, elas devem coincidir quando o funcional linear estiver vinculado ao parâmetro da média.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf

enter image description here

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.