Endogeneidade versus heterogeneidade não observada


13

Qual é a diferença entre endogeneidade e heterogeneidade não observada? Eu sei que a endogeneidade vem, por exemplo, de variáveis ​​omitidas? Mas, tanto quanto eu entendo, a heterogeneidade não observada causa o mesmo problema. Mas onde exatamente está a diferença entre essas duas noções?


a heterogeneidade não observada pode ter interpretações diferentes (o Google não fornece uma definição única, por exemplo), você pode citar algumas referências ou fornecer a definição precisa que deseja ser explicada.
Mpgtas 17/05

@mpiktas: estou analisando o problema de variáveis ​​omitidas em uma regressão. A omissão de variáveis ​​causa problemas com a consistência do estimador. Existem muitos outros problemas que causam inconsistência (causalidade simultânea e erros de medição, por exemplo). Todos esses problemas são conhecidos como endogenidade. Mas, nesse contexto, você costuma ouvir a palavra heterogeneidade não observada. E não tenho certeza se isso é sinônimo de endogenidade? Desculpe, não posso lhe dar mais informações, porque não tem nenhum (Referências estão em polonês, você não entenderia :))
MarkDollar

3
tente-me, eu sei russo, e as fórmulas são iguais para todos os idiomas.
mpiktas

Respostas:


13

Os termos endogeneidade e heterogeneidade não observada geralmente se referem à mesma coisa, mas o uso varia um pouco, mesmo dentro da economia, a disciplina que eu mais associo aos termos.

Em uma equação de regressão, uma variável explicativa é endógena se estiver correlacionada com o termo de erro.

A endogeneidade é frequentemente descrita como tendo três fontes: variáveis ​​omitidas, erro de medição e simultaneidade. Embora seja útil mencionar essas "fontes" separadamente, às vezes surge confusão porque elas não são verdadeiramente distintas. Imagine uma regressão prevendo o efeito da educação sobre os salários. Talvez nossa medida de educação seja simplesmente o número de anos que alguém passou na educação formal, independentemente do tipo de educação. Se eu tiver uma ideia clara de que tipo de educação afeta os salários, posso descrever essa situação como erro de medição na variável educação. Como alternativa, eu poderia descrever a situação como um problema de variáveis ​​omitidas (as variáveis ​​indicando o tipo de educação).

Talvez os salários também afetem as decisões educacionais. Se os salários e a educação são medidos ao mesmo tempo, este é um exemplo de simultaneidade, mas também pode ser reformulado em termos de variáveis ​​omitidas.

A heterogeneidade não observada é simplesmente variação / diferenças entre os casos que não são medidos. Se você entende a endogeneidade, acho que entende as implicações da heterogeneidade não observada em um contexto de regressão.


1
Eu também incluiria a auto-regressão com erros autocorrelacionados e a seleção de amostras, pois outras formas de endogeneidade podem surgir.
Dimitriy V. Masterov

1
@ DimitriyV.Masterov, Obrigado por mencionar esses conceitos, acho que eles estendem o argumento que eu estava fazendo. Por exemplo, um determinado caso de auto-regressão com erros autocorrelacionados ou seleção de amostra não poderia ser reformulado como um problema de variáveis ​​omitidas? Eu sei que não estou te ensinando nada. Eu só quero que os alunos pensem sobre como esses termos estão relacionados e percebam que o mesmo problema estatístico pode ser conceitualizado de várias maneiras.
Michael Bishop

13

Concordo com a descrição de endogeneidade de @ Michael - trata-se de um problema com as variáveis ​​que você inclui e seu relacionamento com as variáveis ​​que você não possui (isto é, as coisas no termo do erro).

iβ+biE(bi)=0

yi=xi(β+bi)+wiγ+ϵi,
yixiwixiϵi (por exemplo, educação está correlacionada com QI, o que não está entre os outros preditores).

yi=xiβ+wiγ+(ϵi+bxi)=xiβ+wiγ+ϵ~i
xiϵ~i

3

Entendo heterogeneidade como qualquer diferença entre indivíduos. A heterogeneidade observada geralmente consiste nas covariáveis ​​e a heterogeneidade não observada consiste em qualquer diferença não observada, como habilidade ou esforço.

Endogeneidade refere-se à relação entre as variáveis ​​observadas e as não observadas, a saber, que elas são dependentes umas das outras.


2

Para finalizar:

  • A heterogeneidade não observada é uma causa possível de endogeneidade.
  • Endogeneidade é, portanto, o termo mais amplo.
  • A heterogeneidade não observada implica endogeneidade, mas não o contrário.

2

a diferença entre heterogeneidade não observada e endogenidade no caso de variáveis ​​omitidas está nas suposições de ortogonalidade feitas. Enquanto no primeiro, a suposição é de que a variável omitida não observada é independente da variável explicativa observada (incluída) x, ... na segunda, essa suposição é relaxada de modo que a variável não observada (omitida) esteja correlacionada com algumas das variáveis ​​observadas variável explicativa (incluída).


-1

Resposta fácil, sem explicação, porque não é desejada: se as variáveis ​​omitidas que causam endogeneidade não são observáveis, chamamos de heterogeneidade não observada. Fácil :)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.