Inclusão da variável dependente defasada na regressão


26

Estou muito confuso sobre se é legítimo incluir uma variável dependente defasada em um modelo de regressão. Basicamente, acho que se esse modelo se concentrar no relacionamento entre a mudança em Y e outras variáveis ​​independentes, a adição de uma variável dependente defasada no lado direito pode garantir que o coeficiente antes de outros IVs seja independente do valor anterior de Y.

Alguns dizem que a inclusão do LDV diminuirá o coeficiente de outros IVs. Alguns outros dizem que se pode incluir LDV, o que pode reduzir a correlação serial.

Eu sei que essa pergunta é bastante geral em termos de que tipo de regressão. Mas meu conhecimento estatístico é limitado e eu realmente tenho dificuldade em descobrir se devo incluir uma variável dependente defasada em um modelo de regressão quando o foco é a alteração de Y ao longo do tempo.

Existem outras abordagens para lidar com a influência de Xs na mudança de Y ao longo do tempo? Tentei diferentes pontuações de alteração como DV, mas o R ao quadrado nessa situação é muito baixo.


11
o que você espera alcançar com o seu modelo? Maximizar o quadrado R raramente é um bom critério de seleção de modelo.
Michael Bishop

Este modelo será usado para previsão. É verdade que, embora o quadrado R seja muito diferente, os valores previstos são realmente os mesmos usando Y ou a alteração de Y. No entanto, dado o valor baixo do quadrado R usando a alteração de Y como DV, isso significa que o valor O conjunto atual de IVs não é capaz de explicar muito bem a alteração e deve haver algumas variáveis ​​omitidas?
user22109

Respostas:


19

A decisão de incluir uma variável dependente defasada em seu modelo é realmente uma questão teórica. Faz sentido incluir um DV atrasado se você espera que o nível atual do DV seja fortemente determinado por seu nível anterior. Nesse caso, não incluir o DV atrasado levará ao viés variável omitido e seus resultados poderão não ser confiáveis. Nesse cenário, incluindo o DV atrasado, a variância será muito grande e provavelmente tornará os efeitos dos outros DV menos significativos (o que significa que os são menores e os erros padrão maiores). No entanto, o que permitirá que você faça é dizer que os IVs que ainda influenciam seu resultado afetam o valor passado do DV. Uma abordagem alternativa é usar a diferença entre a variável de resultado no períodoβte como seu DV para o período .t1t

No entanto, qualquer uma dessas opções implica responder a uma pergunta importante: qual é a estrutura de atraso certa para o seu DV? Você pode obter algumas informações sobre isso observando a correlação entre a variável de resultado e ela própria para diferentes valores de atraso (por exemplo, correlação entre Y e Y , Y e Y , etc.).t1t2


12

Eu recomendo dois artigos:

  1. Achen CH (2001) Por que variáveis ​​dependentes defasadas podem suprimir o poder explicativo de outras variáveis ​​independentes ( link )
  2. Keele, L. e Kelly NJ (2005) Modelos dinâmicos para teorias dinâmicas: os meandros de variáveis ​​dependentes defasadas ( link ).

O resultado é que a inclusão de uma variável dependente defasada pode ter uma grande influência nos coeficientes das demais variáveis. Às vezes isso é apropriado (para os modelos dinâmicos de Keele e Kelly) e às vezes não. Como outros já disseram, é importante pensar no processo que está sendo modelado.


4

A inclusão de variáveis ​​dependentes atrasadas pode reduzir a ocorrência de autocorrelação decorrente da especificação incorreta do modelo. Assim, a contabilização de variáveis ​​dependentes atrasadas ajuda a defender a existência de autocorrelação no modelo. O valor passado afeta o presente no modelo, requer fundamentação teórica e adapta-se melhor ao modelo, conforme necessário.


Não tenho certeza se fiz justiça à última frase; por favor edite se o significado pode ser esclarecida. Bem-vindo ao Cross Validated BTW!
22314 Nick Stauner

11
A autocorrelação pode ser um artefato da maneira como os dados são coletados. Obtive dados digitalizando um gráfico, o que significava que os dados foram classificados. Essa classificação e a relação não linear causaram autocorrelação nos resíduos.
Tony Ladson

2

O que me deixa intrigado com essa questão é não saber mais sobre a especificação do modelo ou a técnica de estimativa para ele. Menciono que, embora o uso de um DV defasado entre os IVs possa ser teoricamente importante e metodologicamente necessário, ele também pode introduzir uma quantidade arriscada de endongeneidade no modelo, dependendo da relação substancial entre variáveis ​​e unidades de tempo e, também, na AR ordem que pode existir no modelo. A menos que você (e nós) tenhamos mais detalhes sobre as variáveis ​​e as estimativas, não me sinto confortável em recomendar o atraso do DV, a menos que você esteja pensando em alguma técnica de variável instrumental ou algo como a estimativa de Arellano-Bond.

Por favor, dê-nos mais detalhes para que possamos saber melhor sobre que tipo de modelo estamos falando.


0

Sim, você deve ter cuidado com o viés de Nickell em uma situação pequena de T grande N (Nickell, S. (1981). Viés em modelos dinâmicos com efeitos fixos. Econometrica: Journal of the Economometric Society, 1417-1426.)

Você pode querer olhar para os modelos de dados dinâmicos do painel, como os estimadores Arellano-Bond ou Blundell-Bond.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.