Os termos endogeneidade e heterogeneidade não observada geralmente se referem à mesma coisa, mas o uso varia um pouco, mesmo dentro da economia, a disciplina que eu mais associo aos termos.
Em uma equação de regressão, uma variável explicativa é endógena se estiver correlacionada com o termo de erro.
A endogeneidade é frequentemente descrita como tendo três fontes: variáveis omitidas, erro de medição e simultaneidade. Embora seja útil mencionar essas "fontes" separadamente, às vezes surge confusão porque elas não são verdadeiramente distintas. Imagine uma regressão prevendo o efeito da educação sobre os salários. Talvez nossa medida de educação seja simplesmente o número de anos que alguém passou na educação formal, independentemente do tipo de educação. Se eu tiver uma ideia clara de que tipo de educação afeta os salários, posso descrever essa situação como erro de medição na variável educação. Como alternativa, eu poderia descrever a situação como um problema de variáveis omitidas (as variáveis indicando o tipo de educação).
Talvez os salários também afetem as decisões educacionais. Se os salários e a educação são medidos ao mesmo tempo, este é um exemplo de simultaneidade, mas também pode ser reformulado em termos de variáveis omitidas.
A heterogeneidade não observada é simplesmente variação / diferenças entre os casos que não são medidos. Se você entende a endogeneidade, acho que entende as implicações da heterogeneidade não observada em um contexto de regressão.