Qual é a estimativa de máxima verossimilhança da covariância de dados normais bivariados quando média e variância são conhecidas?


10

Suponha que tenhamos uma amostra aleatória de uma distribuição normal bivariada que tem zeros como média e uns como variâncias; portanto, o único parâmetro desconhecido é a covariância. Qual é o MLE da covariância? Eu sei que deveria ser algo como 1nj=1nxjyjmas como sabemos disso?


11
Para começar, você não acha um pouco desagradável estimar as médias com x¯ e y¯ quando, na verdade, sabemos que eles são 0 e 0?
Wolfgang

Muito inábil, consertou. Ainda não vejo como isso pode acontecer facilmente. É análogo à variação da amostra, mas por que é o MLE (a menos que ele não é e eu fiz um outro erro)
Stacy

Você excluiu 1ni=1n(xix¯)(yiy¯)? Tomando esta fórmula não significa que você considerex¯ ey¯ como as estimativas dos meios.
Stéphane Laurent

@ StéphaneLaurent Sim, no post inicial, a fórmula foi dada como você a escreveu.
Wolfgang

Respostas:


11

O estimador para o coeficiente de correlação (que no caso de um padrão bivariado normal é igual à covariância)

r~=1ni=1nxiyi

é o estimador de Método dos Momentos, a covariância da amostra. Vamos ver se ela coincide com o estimador de máxima .ρ^

A densidade articular de um padrão bivariado normal com o coeficiente de correlação éρ

f(x,y)=12π1ρ2exp{x2+y22ρxy2(1ρ2)}

e, portanto, a probabilidade logarítmica de uma amostra iid de tamanho én

lnL=nln(2π)n2ln(1ρ2)12(1ρ2)i=1n(xi2+yi22ρxiyi)

(aqui, a suposição iid diz respeito a cada sorteio da população bidimensional, é claro)

ρρ

ρ^:nρ^3(i=1nxiyi)ρ^2(11ni=1n(xi2+yi2))nρ^i=1nxiyi=0

ρ

(1/n)i=1n(xi2+yi2)=(1/n)S2XYn

ρ^:ρ^3r~ρ^2+[(1/n)S21]ρ^r~=0

ρ^(ρ^2r~ρ^+[(1/n)S21])=r~

ρ^=r~(1/n)S2=2

ρ^r~

ρ=0.6n=1.000

i=1nxiyi=522.05,S2=1913.28

O estimador Método dos Momentos nos fornece

r~=522.051000=0.522

O que acontece com a probabilidade de log? Visualmente, temos

insira a descrição da imagem aqui

Numericamente, temos

ρ1st derivlnL0.570.92783.650.5159.41782.470.5247.7781.480.5335.78780.680.5423.64780.10.5511.29779.750.561.29779.640.5714.1779.810.5827.15780.270.5940.44781.050.653.98782.18

e vemos que a probabilidade logarítmica tem um máximo um pouco antes de onde também a 1ª derivada se torna zero . Nenhuma surpresa para os valores de não mostrados. Além disso, a 1ª derivada não tem outra raiz.( ρ = 0,558985 ) ρρ=0.56(ρ^=0.558985)ρ

Portanto, esta simulação está de acordo com o resultado de que o estimador de máxima verossimilhança não é igual ao método do estimador de momentos (que é a covariância da amostra entre os dois rv).

Mas parece que "todo mundo" está dizendo que deveria ... então alguém deveria apresentar uma explicação.

ATUALIZAR

Uma referência que comprova que o MLE é o estimador do Método dos Momentos: Anderson, TW e Olkin, I. (1985). Estimativa de máxima verossimilhança dos parâmetros de uma distribuição normal multivariada. Álgebra linear e suas aplicações, 70, 147-171.
Importa que aqui todos os meios e variações sejam livres para variar e não sejam fixos?

... Provavelmente sim, porque o comentário de @ guy em outra resposta (agora excluída) diz que, com determinados parâmetros de média e variância, o normal bivariado se torna um membro da família exponencial curva (e alguns resultados e propriedades mudam) ... que parece ser a única maneira de reconciliar os dois resultados.


11
Isso é um pouco surpreendente, mas depois de alguma reflexão, isso deve ser esperado. O problema pode ser reformulado como a estimativa do coeficiente de regressão no modelo que . Como não é um modelo linear, não há razão para esperar que o MLE seja um simples produto escalar. A mesma lógica mostra (eu acho!) Que, se conhecermos , o MLE será , e se conhecermos . Se por acaso não conhecermos nenhum, obteremos seu estimador MOM. Y = ρ X + £ £ ~ N ( 0 , ρY=ρX+ϵVar(X)xy/xxxy/yyVar(Y)ϵN(0,1ρ22)Var(X)xy/xxxy/yyVar(Y)
cara

11
@ cara: Muito interessante. Acho que esses argumentos, se um pouco expandidos, merecem ser publicados como uma resposta separada!
Ameba

ϵ2=(yρx)2=y22ρxy+ρ2x2ρ2x2

1ni=1n(xix¯)(yiy¯)n=2y1=y20

11
x2+y22ρxy=(1ρ2)x2+(yρx)2(1ρ2)x2(1ρ2)(yρx)2/(1ρ2)XN(μX,σX2)[Y|X]N(μY+ρXσYσX(XμX),σY|X21ρ22)σY/σX

2

μX=μY=0σX=σY=1n

L(ρ|X,Y)=1(2π[1ρ2])n/2exp[12(1ρ2)(XX2ρXY+YY)].

ρρ^

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.