(postagem bastante longa, desculpe. Inclui muitas informações de plano de fundo, fique à vontade para pular para a pergunta na parte inferior.)
Introdução: Estou trabalhando em um projeto em que estamos tentando identificar o efeito de uma variável endógena binária, , em um resultado contínuo, . Criamos um instrumento, , que acreditamos ser atribuído aleatoriamente.
Dados: Os dados em si estão em uma estrutura de painel com cerca de 34.000 observações espalhadas por 1000 unidades e cerca de 56 períodos de tempo. assume um valor de 1 para cerca de 700 (2%) das observações e faz isso para cerca de 3000 (9%). 111 (0,33%) observações pontuam 1 em e em , e é duas vezes mais provável que uma observação marque 1 em se também marcar 1 em .
Estimativa: Estimamos o seguinte modelo 2SLS através do procedimento ivreg2 da Stata:
Onde é um vetor de outras variáveis exógenas, é o valor previsto de desde o primeiro estágio e e são termos de erro.
Resultados: tudo parece estar funcionando bem; a estimativa de é altamente significativa no primeiro estágio e a estimativa de é altamente significativa no segundo estágio. Todos os sinais são como o esperado, incluindo os das outras variáveis exógenas. O problema é, no entanto, que a estimativa de - o coeficiente de interesse - é implausível grande (ou, pelo menos, de acordo com a maneira como a interpretamos).
varia de 2 a 26, com média e mediana de 17, mas a estimativa de varia de 30 a 40 (dependendo da especificação)!
Fraco IV: Nosso primeiro pensamento foi que isso se devia ao fato de o instrumento ser muito fraco; isto é, não se correlaciona muito com a variável endógena, mas isso realmente não parece ser o caso. Para inspecionar a fraqueza do instrumento, usamos o pacote fraco de Finlay, Magnusson e Schaffer, pois ele fornece testes que são robustos a violações da suposição (que é relevante aqui, pois temos dados em painel e agrupamos nossos SEs em o nível da unidade).
De acordo com o teste de AR, o limite inferior do intervalo de confiança de 95% para o coeficiente do segundo estágio está entre 16 e 29 (novamente dependendo da especificação). A probabilidade de rejeição é praticamente 1 para todos os valores próximos a zero.
Observações influentes: tentamos estimar o modelo com cada unidade removida individualmente, com cada observação removida individualmente e com grupos de unidades removidos. Nenhuma mudança real.
Solução proposta: alguém propôs que não devemos resumir o efeito estimado do instrumentado em sua métrica original (0-1), mas na métrica de sua versão prevista. varia de -0,01 a 0,1 com média e mediana de cerca de 0,02 e um DP de cerca de 0,018. Se fôssemos resumir o efeito estimado de , digamos, com um aumento de um DP em , isso seria (outras especificações dão resultados quase idênticos). Isso seria bem mais razoável (ainda assim substancial). Parece a solução perfeita. Exceto que eu nunca vi alguém fazer isso; todo mundo parece interpretar o coeficiente do segundo estágio usando a métrica da variável endógena original.
Pergunta: Em um modelo IV, é correto resumir o efeito estimado (o LATE, na verdade) de um aumento na variável endógena usando a métrica da versão prevista dela? No nosso caso, essa métrica é probabilidade prevista.
Nota: Usamos 2SLS mesmo que tenhamos uma variável endógena binária (tornando o primeiro estágio um LPM). Angrist & Krueger (2001): “Variáveis instrumentais e a busca por identificação: da oferta e demanda a experiências naturais”) Também tentamos o procedimento de três estágios usado em Adams, Almeida e Ferreira (2009): “ Entendendo a relação entre fundador-CEOs e desempenho da empresa ”. A última abordagem, que consiste em um modelo probit seguido por 2SLS, produz coeficientes menores e mais sensíveis, mas eles ainda são muito grandes se interpretados na métrica 0-1 (cerca de 9-10). Obtemos os mesmos resultados com cálculos manuais que com a opção probit-2sls-no ivtreatreg de Cerulli.
etregress/treatreg
?