Para aqueles que não estão familiarizados com o seguinte snippet de código da Stata, o OP forneceu
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
esta equação pode ser lida como
Yt= α + β1( Va r 1 ) + β2( Va r 1 ) + β3( Va r 1 ) + β4( Y~t - 1)
onde é estimado porY~t - 1
Y~t - 1= α + Z1( Δ2Yt) + Z2( Δ3Yt) + Z3( Δ4Yt)
(ou seja, o primeiro estágio da equação IV está entre parênteses no código Stata)
Os deltas representam diferenças de segunda, terceira e quarta ordem e são usados como instrumentos excluídos para estimar o atraso da variável dependente.
No código Stata, o L.
indica o atraso dessa variável em e significa diferenças de primeira ordem dessa variável e, portanto, significa diferenciação de segunda ordem.t - 1D.
D2.
Inicialmente, eu não conseguia pensar em nenhum raciocínio lógico por que alguém faria isso. Mas Kwak apontou (referenciando este artigo ) que o método Arellano-Bond utiliza as diferenças como instrumentos para estimar o componente auto-regressivo do modelo. (Também intencionalmente, eu assumi que as diferenças só teriam efeito se a série não fosse estacionária, o que Bond afirma nesse papel vinculado que as diferenças serão apenas instrumentos fracos no caso de a série ser uma caminhada aleatória, na pág. 21 )
Como sugestões para mais material de leitura como introdução às variáveis instrumentais,
Outro pôster nesta resposta (Charlie), vinculado a alguns slides que ele preparou que eu gosto e sugeriria, vale a pena procurar uma introdução às variáveis instrumentais. Eu também sugeriria este powerpoint que um professor meu também preparou para uma oficina como introdução. Como última sugestão, para qualquer pessoa interessada em aprender mais sobre variáveis instrumentais, você deve procurar o trabalho de Joshua Angrist.
Aqui está a minha resposta inicial
Embora eu concorde com tudo o que Kwak e ars declararam, ainda não consigo pensar em nenhum motivo para alguém usar as diferenças da variável dependente como instrumento para estimar o atraso da variável dependente (se as pessoas não souberem o código Stata, o L.
indica atraso nessa variável em e significa diferenças de primeira ordem dessa variável e, portanto, significa diferenciação de segunda ordem).t - 1D.
D2.
Em todas as aplicações que eu vi, as pessoas usam o atraso de variáveis independentes como instrumentos para estimar o atraso da variável dependente (por razões sobre as quais falamos). Mas isso se baseia na suposição de que as variáveis independentes atrasadas são exógenas ao termo do erro no período em que estão sendo aplicadas.
Não conheço nenhum raciocínio em que as diferenças da variável dependente sejam consideradas exógenas. Até onde eu sei, não é prática aceita diferenciar apenas um lado da equação e produziria resultados bastante ilógicos ( aqui está um artigo que critica alguém sobre a situação inversa na qual eles incluíram um nível de variáveis como preditor de uma série diferenciada.) Se você reorganizar os termos na equação IV, ele realmente se parecerá com um teste Dickey Fuller aumentado.
Embora a resposta mais simples seja perguntar à pessoa que escreveu o código, alguém pode dar um exemplo em que esse procedimento seria aceitável ou qualquer situação em que esse procedimento retornasse alguns resultados significativos? Como não consigo pensar em nenhum raciocínio lógico, por que as diferenças afetariam os níveis, exceto no caso de a série não ser estacionária.