Por que usar um DV atrasado como uma variável instrumental?

12

Eu herdei alguns códigos de análise de dados que, como não economista, estou lutando para entender. Um modelo executa uma regressão de variáveis instrumentais com o seguinte comando Stata

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

Este conjunto de dados é um painel com várias observações seqüenciais para este conjunto de variáveis.

Por que esse código está usando os valores defasados do DV como instrumentos? Pelo que entendi (da pesquisa em um livro antigo), a estimativa IV é usada quando há um problema por causa de um regressor sendo correlacionado com o termo do erro. No entanto, nada é mencionado sobre a escolha de defasagens do DV como instrumentos.

Um comentário nesta linha do código menciona "causalidade". Qualquer ajuda para descobrir qual era o objetivo aqui seria muito bem-vinda.

regression stata instrumental-variables

— laramichaels
fonte

Na sua pergunta, você pode estar lendo o código um pouco errado. A sintaxe está usando as diferenças como "instrumentos" para estimar o atraso da variável dependente.

— Andy W

lara: você poderia editar sua pergunta para explicar em termos simples o significado do código stata cortado?

— user603

7

Edit: Dado o esclarecimento sobre o código de dados fornecido por Andy W abaixo, mudei minha resposta para resolver melhor a questão. Você encontrará a versão antiga da minha resposta abaixo da atual.

Parece que seu código é uma tentativa desajeitada de fazer o DIY do estimador Arellano-Bond (assumindo estimativas ivreg com 2SOLS). Você pode encontrar mais detalhes sobre o uso e a lógica do estimador A / B neste belo artigo de revisão e nesta introdução mais ampla.

Em poucas palavras e dentro de três linhas: embora o estimador A / B seja realmente um estimador IV (generalizado), ele não é usado para resolver nenhum problema de causalidade. As IVs neste contexto são usadas para fornecer uma estimativa eficiente do coeficiente de RA no contexto dos dados do painel.

Eu recomendaria não reinventar a roda aqui e, em vez disso, usar a caixa de ferramentas pronta para realizar essas estimativas. Para stata, você pode usar o pacote XTABOND2 (ou XTABOND se estiver executando o STAT11).

resposta antiga:

Um exemplo simples irá ajudá-lo aqui. Suponha que você tenha duas variáveis e amostradas ao longo do tempo, de modo que a correlação entre e seja muito alta. Você gostaria de fazer uma reivindicação sobre causando mas infelizmente existe uma teoria concorrente e credível muito boa, sob a qual causa . $x_t$ $y_t$ $x_t$ $y_t$ $x_t$ $y_t$ $y_t$ $x_t$

Para separar os dois modelos concorrentes, você regride em (em vez de ). Freqüentemente, você perde em precisão (ou seja, a correlação entre variáveis amostradas em momentos diferentes é geralmente menor que a correlação entre variáveis amostradas simultaneamente). $y_t$ $x_{t-1}$ $x_t$

A maneira como os dois modelos concorrentes - e - agora são desembaraçados é que, presumivelmente, não existe uma boa teoria sob a qual um de um O período anterior pode ser causado por um atual ('o passado não pode ser causado pelo futuro'), excluindo o segundo senso de causalidade. $y_t\leftarrow x_{t-1}$ $x_{t-1} \leftarrow y_{t}$ $x$ $y$

Observe que o uso desse truque é válido apenas se as duas variáveis ( e forem estacionárias ). $y_t$ $x_{t-1}$ $I(0)$

— user603
fonte

+1 Concorde com esta interpretação, parecendo DIY Arellano-Bond. NB: Eu achei a Arellano-Bond confiável somente quando o número de unidades transversais é muito grande - como em centenas. Arellano sugere isso em seus artigos e livros, indicando que a consistência está no número de unidades de seção transversal e a taxa de convergência não é tão rápida.

— Cyrus S

5

Como não conheço o Stata, não posso comentar sobre o modelo específico. Mas o uso de variáveis atrasadas é uma abordagem bastante comum quando se trata de viés de simultaneidade em geral e na criação de variáveis instrumentais em particular.

Digamos que você tenha um feedback entre duas variáveis em seu modelo: a variável independente (como preço) e a variável dependente (como quantidade). Então ambos são endógenos (suas causas surgem de dentro do modelo) e perturbações no termo do erro afetarão ambas as variáveis.

Para resolver isso, você deseja tornar a variável independente (preço) exógena para que as perturbações no erro afetem apenas a variável dependente (quantidade). Isso é feito criando novas variáveis exógenas, regredindo as outras variáveis exógenas em seu modelo no preço. Essas novas variáveis exógenas são suas variáveis instrumentais (IVs). Os IVs são derivados de termos exógenos e, portanto, não estão correlacionados com o erro.

Mas, para fazer isso, você precisa descobrir quais variáveis são exógenas para que possam ser usadas para derivar os IVs. Podemos notar que as variáveis atrasadas "ocorreram" no passado e, portanto, não podem ser correlacionadas com o erro no presente. As variáveis atrasadas são, portanto, exógenas e se tornam candidatas convenientes à derivação de IVs. (No entanto, observe que o argumento anterior falha quando os erros são correlacionados automaticamente.)

Uma boa introdução e referência a isso é a econometria introdutória: uma abordagem moderna de Wooldridge.

— ars
fonte

5

Para aqueles que não estão familiarizados com o seguinte snippet de código da Stata, o OP forneceu

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

esta equação pode ser lida como

$Y_t = \alpha + \beta_1 (Var1) + \beta_2 (Var1) + \beta_3 (Var1) + \beta_4 (\tilde{Y}_{t-1})$

onde é estimado por $\tilde{Y}_{t-1}$

$\tilde{Y}_{t-1} = \alpha + Z_1(\Delta^{2}Y_t) + Z_2(\Delta^{3}Y_t) + Z_3(\Delta^{4}Y_t)$

(ou seja, o primeiro estágio da equação IV está entre parênteses no código Stata)

Os deltas representam diferenças de segunda, terceira e quarta ordem e são usados como instrumentos excluídos para estimar o atraso da variável dependente.

No código Stata, o L.indica o atraso dessa variável em e significa diferenças de primeira ordem dessa variável e, portanto, significa diferenciação de segunda ordem. $t-1$ D.D2.

Inicialmente, eu não conseguia pensar em nenhum raciocínio lógico por que alguém faria isso. Mas Kwak apontou (referenciando este artigo ) que o método Arellano-Bond utiliza as diferenças como instrumentos para estimar o componente auto-regressivo do modelo. (Também intencionalmente, eu assumi que as diferenças só teriam efeito se a série não fosse estacionária, o que Bond afirma nesse papel vinculado que as diferenças serão apenas instrumentos fracos no caso de a série ser uma caminhada aleatória, na pág. 21 )

Como sugestões para mais material de leitura como introdução às variáveis instrumentais,

Outro pôster nesta resposta (Charlie), vinculado a alguns slides que ele preparou que eu gosto e sugeriria, vale a pena procurar uma introdução às variáveis instrumentais. Eu também sugeriria este powerpoint que um professor meu também preparou para uma oficina como introdução. Como última sugestão, para qualquer pessoa interessada em aprender mais sobre variáveis instrumentais, você deve procurar o trabalho de Joshua Angrist.

Aqui está a minha resposta inicial

Embora eu concorde com tudo o que Kwak e ars declararam, ainda não consigo pensar em nenhum motivo para alguém usar as diferenças da variável dependente como instrumento para estimar o atraso da variável dependente (se as pessoas não souberem o código Stata, o L.indica atraso nessa variável em e significa diferenças de primeira ordem dessa variável e, portanto, significa diferenciação de segunda ordem). $t-1$ D.D2.

Em todas as aplicações que eu vi, as pessoas usam o atraso de variáveis independentes como instrumentos para estimar o atraso da variável dependente (por razões sobre as quais falamos). Mas isso se baseia na suposição de que as variáveis independentes atrasadas são exógenas ao termo do erro no período em que estão sendo aplicadas.

Não conheço nenhum raciocínio em que as diferenças da variável dependente sejam consideradas exógenas. Até onde eu sei, não é prática aceita diferenciar apenas um lado da equação e produziria resultados bastante ilógicos ( aqui está um artigo que critica alguém sobre a situação inversa na qual eles incluíram um nível de variáveis como preditor de uma série diferenciada.) Se você reorganizar os termos na equação IV, ele realmente se parecerá com um teste Dickey Fuller aumentado.

Embora a resposta mais simples seja perguntar à pessoa que escreveu o código, alguém pode dar um exemplo em que esse procedimento seria aceitável ou qualquer situação em que esse procedimento retornasse alguns resultados significativos? Como não consigo pensar em nenhum raciocínio lógico, por que as diferenças afetariam os níveis, exceto no caso de a série não ser estacionária.

— Andy W
fonte

Olá Andy. Eu não sei o código stata. É por isso que não mencionei o código capturado na minha resposta, que deve ser entendido como uma resposta à parte da pergunta formulada em inglês.

— user603

@kwak - Eu não estava criticando sua postagem, concordo com tudo o que você disse. Eu estava simplesmente me perguntando se havia alguma lógica sobre por que alguém usaria as diferenças como instrumentos dos quais eu desconhecia. Não consigo imaginar nenhuma situação em que as diferenças atendam a algum dos requisitos para esse procedimento.

— Andy W

Oi Andy:> Não aceitei seu comentário como crítico. Sua postagem está destacando um aspecto essencial da pergunta que nem eu nem Rob (reconhecemos) entendemos. Se alguma coisa, ilustra a importância da colaboração.

— usar o seguinte comando

+1. Não vi tudo isso antes - Obrigado por observar o problema, bem como o curso intensivo / mini-em notação de status Tomei seu primeiro comentário para sugerir que a interpretação estava errada e respondida em um sentido muito geral. Fico feliz que você tenha sido mais persistente e que o kwak descobriu.

— quer