Forma reduzida de modelo econométrico, problema de identificação e teste


7

Procurando ajuda para entender o seguinte problema e como usar o formulário reduzido em econometria

Considere um modelo para a saúde de um indivíduo:

health=b0+(b1)age+(b2)weight+(b3)height+(b4)male+(b5)work+(b6)exercise+u

suponha que todas as variáveis ​​na equação, com exceção do exercício, não estejam correlacionadas com u.

A) Anote a forma reduzida para exercício e indique as condições sob as quais os parâmetros da equação são identificados.

B) Como a suposição de identificação na parte c pode ser testada?


É correto assumir:

exercise=b0+(b1)age+(b2)weight+(b3)height+(b4)male+(b5)work+u
como a forma reduzida?

e é a condição para a identificação de parâmetros simplesmente

E(exercise|u)=0

e como posso testá-lo? Mas, além disso, para que serve?

Respostas:


3

Esta é a pergunta muito padrão sobre variáveis ​​instrumentais de modelos lineares de equação única. Dadas as primitivas da sua pergunta, a única variável endógena é o exercício . Para responder a essa pergunta específica, você precisa de uma variável exótica, z , que satisfaça duas condições:

  1. cov (z, u) = 0.
  2. Deve haver uma relação entre a variável endógena e essa variável exógena que você está propondo, mas ela não fazia parte do verdadeiro modelo postulado (o modelo estrutural). Em outras palavras, com , e ortogonal a todas as suas variáveis ​​explicativas (que não sejam exercício) e z.
    exercise=β0+β1age+β2weight+β3height+β4male+β5work+ϕz+εexercise
    ϕ0E(εexercise)=0

Antes de prosseguir, uma observação. Por modelo estrutural, quero dizer, seguindo a convenção de Wooldridge e Goldberger, o modelo postulado. Ou seja, o modelo que afirma a relação causal entre a saúde e suas covariáveis. Esta é uma diferença fundamental e um desacordo com as respostas anteriores.

Agora, voltando ao problema em questão, a condição 2 é o que na literatura de equações simultâneas chama de equação de forma reduzida , que nada mais é do que uma projeção linear do endógeno em todas as variáveis ​​exógenas, incluindo z.

Agora, conecte o formulário reduzido ao seu modelo postulado e você obterá

health=α0+α1age+α2weight+α3height+α4male+α5work+δz+ν
onde , e . Pela definição de projeção linear, não está correlacionado com todas as variáveis ​​explicativas e, portanto, o OLS dessa última equação produzirá estimativas consistentes para e , e não o subjacente no modelo verdadeiro.αi=bi+b6βi,i{1,,5}δ=b6ϕν=u+b6εexerciseναiδbi

A identificação requer um pouco de manipulação na forma de matriz, mas essencialmente se reduz à chamada condição de classificação . Defina e para que seu modelo estrutural seja . Agora defina . Pela condição 1 (cov (z, u) = 0, de modo que E (z, u) = 0), Se você multiplicar os lados do modelo estrutural por e tomar as expectativas que você tem Posição condição estados quex = ( 1 , a g e , , e x e r c i s e ) b=(b0,,b6)x=(1,age,,exercise)health=xb+uz(1,age,,work,z)

E(zu)=0
z
E(zx)b=E(zy)
E(zx)é a classificação da coluna completa. Neste exemplo em particular e dadas condições em z, isso equivale à Portanto, temos 6 equações em 6 incógnitas. Portanto, existe um único solução para o sistema, isto é, é identificada e é igual a , conforme desejado.b [ E ( z x ) ] - 1 E ( z y )rank(E(zx)=6b[E(zx)]1E(zy)

Comentários: A condição 1 é útil para obter a condição de momento, mas o modelo de formulário reduzido com é crucial para a condição de classificação. Ambas as condições são usuais.ϕ

Neste ponto, deve ficar claro por que precisamos disso. Por um lado, sem z, o estimador OLS do modelo verdadeiro produzirá estimadores inconsistentes, não apenas para mas para todos os . Por outro lado (e um pouco relacionados), nossos parâmetros são identificados de forma exclusiva, portanto, temos certeza de que estamos estimando a verdadeira relação causal, conforme declarado em nosso verdadeiro modelo.b ib6bi

Em relação ao teste, a condição 2 (z e exercício estão parcialmente correlacionados) pode ser testada diretamente e você deve sempre relatar esse passo contrário ao comentário em uma resposta anterior. Existe uma enorme literatura em relação a esta etapa, especialmente a literatura de instrumentos fracos.

A segunda condição não pode ser diretamente testada, no entanto. Às vezes, você pode invocar a teoria econômica para justificar ou fornecer hipóteses alternativas que suportem o uso de z.


3

A pergunta não faz muito sentido para mim, como afirmado. Se o problema disser que o exercício é endógeno (correlacionado com o termo do erro), você não pode assumir o oposto na solução. Além disso, geralmente se fala de forma reduzida versus estrutural no contexto da estimativa IV. Se o exercício for endógeno, você precisará de um instrumento (variável que prediz o exercício, mas que não afeta a saúde de outra forma) para obter efeitos causais. Por exemplo, se algumas pessoas da sua amostra ganharam aleatoriamente cupons de associação à academia, esse poderia ser um instrumento válido.

As premissas de identificação seriam então

  1. cupom realmente prevê exercício

  2. o cupom é ortogonal parau

O que é chamado de forma estrutural seria duas equações, uma do seu modelo original, a outra regressão do exercício no cupom e outras variáveis ​​explicativas do modelo original (o primeiro estágio). A forma reduzida seria quando você substituir o primeiro estágio na equação principal, assim você regride a saúde em idade, peso, ..., trabalho e cupom (mas não o exercício , pois foi substituído). Às vezes, a forma reduzida é usada para explicar as propriedades da estimativa IV, mas o AFAIK não é muito usado na prática.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.