OLS:


8

Suponha que sejam séries com , ( e é semelhante ao , mas muda quando o manequim = 1). e , . Em um cenário do mundo real, haverá retornos periódicos do mercado de ações sobre as empresas (mas você pode ignorar isso). Existe um dummy, que é igual à unidade acima de e igual a zero caso contrário. O modelo de série temporal a ser estimado com OLS é:Xit,YitXitN(0.1,1)σ2(Yit)=1mean(Yit)Xitt{1,2,...,200}i{1,2,...,N}NDtt{150,151,...,200}i

(1)Yit=αi+βiXit+γiDt+ϵit

Esse modelo geralmente adere às premissas de Gauss-Markov para cada . No entanto, temos para todo e .iE[ϵitTϵjt]0ij

O próximo passo é construir um vetor de gama usando as estimativas do modelo . Chame esse vetor de . Em seguida, usamos isso no modelo transversal:Nγ(1)γ^

(2)γ^i=a+bZi+ui

onde é uma variável transversal que não causa violações nas suposições do OLS e é relevante para explicar .γ iZiγ^i


A alegação na literatura econométrica aplicada é que no modelo leva a (i) Não há problema para as estimativas do coeficiente de OLS em , mas (ii) erros padrão tendenciosos em .( 1 ) ( 2 ) ( 2 )E[ϵitTϵjt]0(1)(2)(2)

  • Alguém pode postar idéias sobre por que esse é o caso?

  • Eu não entendo o que está na expressão . Claro que é um escalar e você não pode transpor um escalar. Isso é visto AQUI , onde eles aplicam essa metodologia. E [ ε t i t ε j t ] 0 ε i tϵitTE[ϵitTϵjt]0ϵit


1
Você diz que não entende por que as estimativas de variação são tendenciosas na eq 2 e depois diz que podemos ignorar sua estimativa que, por acaso, é a equação 2? Acho que entendo o que você quer dizer e poderia dar uma resposta especulativa a isso, mas será melhor para você precisar sua pergunta. γ
JDav

1
Na sua configuração, não pode ser estacionário, pois sua média depende de . tYitt
precisa saber é o seguinte

Existem três versões da expectativa (uma no título, outra no corpo e uma terceira nos comentários). Todos eles incorporam uma transposição misteriosa, embora em todos os casos apenas estejam presentes escalares. Você se importa de editar sua postagem para esclarecer?
cardeal

@mpiktas Observação correta, tem média diferente após (dado ). Obrigado. t = 150 γ i0Yitt=150γi0

Algumas boas respostas foram apresentadas - eu apenas acrescentaria que isso precisa ser estimado como um modelo de coeficientes aleatórios (também conhecido como modelo multinível para sociólogos e psicólogos, também conhecido como modelo misto para bioestatísticos). Se os economistas não sabem disso e o estimam com um procedimento de duas etapas, isso é muito ruim para eles (e ainda estou esperando que os erros padrão de Fama-Macbeth morram, o que aparentemente eles simplesmente não querem fazer).
StasK 23/08/12

Respostas:


3

Para ter certeza de que você precisa entrar nos detalhes, isso implica comparar a matriz de covariância de variância verdadeira com a que você obtém no segundo estágio de ols.

O verdadeiro :

Isso pode ser obtido substituindo a eq.2 na eq.1, o OLS agrupado segue e, a partir dele, a verdadeira matriz de covariância de variância :a^,b^

Yit=αi+βiXit+aDt+bDtZi+Dtui+ϵit

O uso da notação de matriz para dividir a equação nos parâmetros e outros leva a:γ

Y=Xθ+Zγ+ε

onde estamos interessados ​​em , , Z é um vetor de duas colunas (uma estrutura semelhante define X, mas isso não interessa) e onde tem uma estrutura completa de covariâncias entre empresas, é por isso que não é diagonal ( ) como nas suposições de GAUSS-MARKOV. Por Frish-Waugh, podemos expressar ols como:γ = [ umV(γ^)Z = [ D tγ=[ab] V ( ε ) = Σ σ 2 I N T γZ=[DtDtZi][i=1,..,N;t=1,...,T]V(ε)=Σσ2INTγ

HX=I-X(X'X)-1X'γ^=(ZMXZ)1ZMXY queMX=IX(XX)1X

o que implica a seguinte variação verdadeira:

H = ( Z ' M X Z ) - 1 Z " M XV(γ^)=HΣH ondeH=(ZMXZ)1ZMX

O outro

Sob o pressuposto de empresas não correlacionadas (e períodos, mas esse não é o problema), tem uma estrutura diagonal mais simples . Isso significa que termos triangulares são 0. Sob uma especificação ainda mais simples, (aquela que é estimada por padrão por software econométrico e estatístico para OLS) segue as premissas de GAUSS-Markov, significando que mesmo os termos diagonais são iguais é rebaixado paraΔ Δ Σ σ σ 2 IΣΔΔΣΣσ2I

Isso implica que não considerar a correlação entre empresas levaria a como:V(γ^)

V ( γ ) = H σ 2 I H 'σ 2 ( Z ' M x Z ) - 1V(γ^)=HΔH ouV(γ^)=Hσ2IHσ2(ZMxZ)1

que, como pode ser visto, não são iguais ao verdadeiro.


Com palavras diferentes .. Estou basiclly dando os mesmos @mpiktas resposta deu
JDav

(1) Realmente fantástico. (2) Parece que você ignorou quando expressou o modelo em forma de matriz? Isso não deve mudar nada do que você fez. (3) Você saberia por que o Portfolio OLS fornece SEs corretas? (Veja o artigo de 1986 que eu vinculei). Não se preocupe com a resposta (3) se não gostar de descobrir esse problema. Diui

(2) Não coloquei todas as definições para permitir intuição e evitar os produtos kronecker ... desta forma, a demonstração é "mais rápida". Mas você pode deduzir que o novo termo aleatório é , isto significa que se as empresas foram correlacionados por então isso faz com que o novo termo aleatório a ser correlacionados em seu dimensão das empresas também. (3) não ouvi falar de um OLS de portfólio, mas acho que é apenas um outro nome para algo que já existe na econometria padrão para u i ε i tεit=Dtui+ϵituiεit
deletar

(3) uma boa estimativa implica uma boa estimativa, os OLS carteira de alguma forma está estimando a estrutura completa e não apenas as variações sem covariâncias: ou uma única variação:Σ ô σ 2ΣΣΔσ2
JDav

2
Eu acho que a notação é imprecisa, ele usa escalares onde os vetores são necessários para se referir ao fato de que covariâncias entre empresas não são zero, então sua notação implica é um vetor de N linhas. Outra interpretação é que ele está se referindo ao elemento . Em ambos os casos, ele quer dizer a mesma coisa, mas como não é uma quantitativos ambigüidades jornal em notação matemática acontecer ... i j ε T . t ϵ . tϵit=[ϵit]i=1,...,Nijϵ.tTϵ.t
JDav

2

Estou colocando outra resposta com mais detalhes.

No modelo de regressão linear padrão (em forma de matriz):

Y=Xβ+ε

a estimativa OLS é a seguinte

β^=(XTX)1XTY.

Sua variação então é

Var(β^)=(XTX)1XTVar(Y)X(XTX)1.

A suposição usual para regressão é que

Var(Y)=σ2I,

onde sou a matriz de identidade. EntãoI

Var(β^)=σ2(XTX)1.

Agora, no seu caso, você tem dois modelos:

Yi=Miδi+ϵi

e

Γ=Lc+u,

Onde

  • YiT=(Yi1,...,YiT) ,
  • Mi=[1,Xi,D] , com ,XiT=(Xi1,...,XiT)DT=(D1,...,DT)
  • δiT=(αi,βi,γi)
  • ϵiT=(ϵi1,...,ϵiT)
  • ΓT=(γ1,...,γn)
  • L=[1,Z] , comZT=(Z1,...,Zn)
  • cT=(a,b)
  • uT=(u1,...,uN) .

Observe que você declara o segundo modelo para as estimativas de , o que não é usual, portanto, reafirmo-o na forma usual, para o "verdadeiro" .γγ

c

Var(c^)=(LTL)1LTVar(Γ)L(LTL)1

O problema é que não observamos . Observamos as estimativas . faz parte do vetorΓΓ^γ^i

δ^i=δi+(MiTMi)1MiTϵi.

Suponha que seja aleatório e independente com e . Isso certamente vale para para não perdermos nada se estendermos isso para outros elementos de .δiϵiMiγiδi

Vamos empilhar todos sobre os outros:δ^i

δ^T=[δ1T,...,δNT]

e explore a variação de :δ^

Var(δ^)=[Var(δ^1)cov(δ^1,δ^2)cov(δ^1,δ^N)cov(δ^n,δ^1)cov(δ^n,δ2)Var(δ^N)]

Suponha que e que . Para , temosVar(ϵi)=σϵ2IEϵiϵjT=0ij

cov(δ^i,δ^j)=cov(δi,δj)+cov((MiTMi)1MiTϵi,(MjTMj)1MjTϵj)=(MiTMi)1MiTE(ϵiϵjT)Mj(MjTMj)1=0

Para elementos diagonais, temos

Var(δ^i)=Var(δi)+σϵ2(MiTMi)1

Vamos voltar à variação de . Como substituímos vez de a variação é a seguintec^Γ^Γ

Var(c^)=(LTL)1LTVar(Γ^)L(LTL)1,

Podemos extrair de selecionando os elementos apropriados:Var(Γ^)Var(δ^)

Var(Γ^)=Var(Γ)+diag(g1,...,gn)

onde é o elemento de correspondente ao . Cada é diferente de pois corresponde a e que não são assumidos como iguais.giσϵ2(MiTMi)1Var(γ^i)gigjXitXjt

Portanto, obtemos o resultado surpreendente: que algebricamente, mesmo que assumamos todas as propriedades necessárias, a matriz de covariância resultante, pelo menos algebricamente, não será igual à matriz de covariância OLS usual, pois para isso precisamos que seja constante vezes matriz de identidade que claramente não é.Var(Γ^)

Todas as fórmulas acima foram derivadas assumindo que são constantes e, portanto, são condicionais em . Isso significa que realmente calculamos . Colocando suposições adicionais em , acho que seria possível mostrar que a variação incondicional está correta.XijXijVar(Γ^|X)Xij

A suposição de independência colocada em também pode ser relaxada até a falta de correlação. ϵi

Também seria possível usar o estudo de simulação para ver como a matriz de covariância difere se usarmos vez de .Γ^Γ


1

Eu acho que o problema está na definição do segundo modelo. Eu acho que é assumido que

γi=a+bZi+ui

com a suposição usual de que

cov(γi,γj|Z1,...,ZN)=0,

isto é, o não está correlacionado se controlarmos o . Agora, quando você substitui vez de , precisa verificar se a suposição é válida, ou seja, seZ i γ γγiZiγ^γ

cov(γi^,γ^j|Zi)=0.

Agora

γ^i=γi+L(ϵit),

onde é alguma função linear. É seguro assumir que é independente de , mas se , a suposição necessária não se mantém.ε i t Z i E ε i t ε j t0LϵitZiEϵitϵjt0

Como a suposição de não correlação é central para o cálculo das estatísticas comuns do OLS, isso explica o motivo pelo qual os erros padrão são enviesados.

Este foi um esboço, mas acho que a idéia deve funcionar se você entrar em detalhes minuciosos das máquinas OLS.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.