A resposta de JohnRos é muito boa. Em inglês simples, endogeneidade significa que você errou a causa. Que o modelo que você anotou e estimou não capta adequadamente a maneira como a causação funciona no mundo real. Quando você escreve:
Yi=β0+β1Xi+ϵi
você pode pensar nessa equação de várias maneiras. Você pode pensar nisso como uma maneira conveniente de prever base nos valores deVocê pode pensar nisso como uma maneira conveniente de modelar . Em qualquer um desses casos, não existe endogeneidade, e você não precisa se preocupar com isso.X E { S | X }YXE{Y|X}
No entanto, você também pode pensar na equação como incorporando causalidade. Você pode pensar em como a resposta à pergunta: "O que aconteceria com se eu chegasse a esse sistema e aumentasse experimentalmente 1 em ?" Se você quiser pensar dessa maneira, usar o OLS para estimar equivale a supor que: Y Xβ1YX
- YX causaY
- Yϵ causaY
- Xϵ não causaX
- XY não causaX
- Nada que causa também causaXϵX
A falha de qualquer um dos 3-5 geralmente resultará em , ou, não de maneira equivalente, . Variáveis instrumentais é uma maneira de corrigir o fato de você ter errado a causa (fazendo outra suposição causal diferente). Um estudo randomizado controlado perfeitamente conduzido é uma maneira de forçar 3-5 a ser verdade. Se você escolher aleatoriamente, com certeza não será causado por , ou qualquer outra coisa. Os chamados métodos de "experimento natural" são tentativas de encontrar circunstâncias especiais no mundo em que 3-5 são verdadeiras, mesmo quando não pensamos que 3-5 sejam verdadeiras.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0Cov(X,ϵ)≠0XYϵ
No exemplo de JohnRos, para calcular o valor salarial da educação, você precisa de uma interpretação causal de , mas há boas razões para acreditar que 3 ou 5 são falsos.β1
Sua confusão é compreensível, no entanto. É muito típico em cursos sobre o modelo linear o instrutor usar a interpretação causal de eu dei acima, fingindo não apresentar a causa, fingindo que "tudo é apenas estatística". É uma mentira covarde, mas também é muito comum. β1
De fato, faz parte de um fenômeno maior na biomedicina e nas ciências sociais. É quase sempre o caso em que estamos tentando determinar o efeito causal de em - é disso que se trata a ciência, afinal. Por outro lado, também é quase sempre o caso de uma história que você pode contar, levando à conclusão de que uma das 3 a 5 é falsa. Portanto, existe um tipo de desonestidade praticada, fluida e equivocada, na qual eliminamos objeções dizendo que estamos apenas fazendo um trabalho associativo e depois escondemos a interpretação causal em outro lugar (normalmente nas seções de introdução e conclusão do artigo).YXY
Se você está realmente interessado, o cara a ler é Judea Perl. James Heckman também é bom.
R
.