Considere o seguinte modelo de regressão múltipla:
Aqui é um vetor n \ vezes 1 coluna; Matriz X a n \ times (k + 1) ; \ beta a (k + 1) \ vezes 1 vetor de coluna; Z a n \ vezes l matriz; \ delta a l \ times 1 vetor de coluna; e U , o termo do erro, um vetor de coluna n \ times1 .
QUESTÃO
Meu professor, o livro Introdução à Econometria, 3ª ed. por James H. Stock e Mark W. Watson, p. 281, e Econometria: Sessão de Revisão do Exame de Honra (PDF) , p. 7, expressou o seguinte para mim.
- Se assumirmos o que é chamado de independência média condicional , que por definição significa que
e se a suposição de mínimos quadrados for satisfeita, exceto a suposição condicional média zero (então assumimos ) (consulte 1 -3 abaixo),
então, o estimador OLS de em permanece imparcial e consistente, sob esse conjunto mais fraco de suposições.
Como provo essa proposição? Ou seja, os itens 1 e 2 acima implicam que a estimativa OLS de nos fornece um estimador imparcial e consistente para ? Existe algum artigo de pesquisa que comprove essa proposição?
COMENTE
O caso mais simples é dado considerando-se o modelo de regressão linear e provando que a OLS estima de é imparcial se para cada .
PROVA DE UNBIASEDNESS, ASSUMINDO QUE E SÃO DISTRIBUÍDOS CONJUNTAMENTE
Defina e eAssim pode ser reescrito como Por segue-se que Agora, como e são normalmente distribuídos em conjunto, a teoria das distribuições normais, cf. Derivando as distribuições condicionais de uma distribuição normal multivariada , diz que (de fato, não precisamos assumir a normalidade das articulações, mas apenas essa identidade) para alguns por vetor
Agora torna-se Para o modelo todas as suposições de mínimos quadrados são satisfeitas, pois o termo de erro satisfaz a suposição de condições condicionais. significa zero. Isso implica que a estimativa de OLS de será imparcial, pois se deixarmos e deixar ser o por matriz composta de e , a estimativa de OLS de em é dada considerando o seguinte:
e assim onde a segunda linha segue por . Portanto, é uma estimativa condicionalmente imparcial de já que a estimativa do OLS fornecida para o modelo coicida com a fornecida para o modelo . Agora, pela lei da expectativa total e, portanto, é um estimador imparcial para .
(Pode-se observar que , de modo que o coeficiente em não seja necessariamente imparcial.)
No entanto, o caso especial acima pressupõe que e são normalmente distribuídos em conjunto. Como provar a proposição sem essa suposição?
Supondo que sempre suficiente, é claro (cf. ), mas devo derivar o resultado apenas usando e a suposição de mínimos quadrados, excluindo a suposição Condial Mean Zero ( ver abaixo).
RELATIVO À CONSISTÊNCIA
Penso que também se pode ver que a estimativa é consistente para observando que no modelo de regressão todas as suposições de mínimos quadrados são satisfeitas, incluindo a suposição de que o (novo) termo de erro satisfaz a Suposição Condicional do Zero Médio (cf. e veja abaixo).
Posso acrescentar uma prova de consistência mais tarde, baseada em uma série de exercícios em Introdução à Econometria, 3ª ed. por James H. Stock e Mark W. Watson, cap. 18. No entanto, essa prova é bastante longa. Mas o ponto aqui é que a prova fornecida nos exercícios assume , então ainda estou me perguntando se a suposição realmente é suficiente.
SUBQUERY 1
Em Introdução à Econometria, 3ª ed. por James H. Stock e Mark W. Watson, diz-se, na p. 300, que a suposição pode ser "relaxada" usando a teoria da regressão não linear. O que eles podem ou querem dizer com isso?
AS PRIMEIRAS PREMISSAS PRAÇAS
Excluo aqui a suposição condicional do zero médio que pois a proposição que tentamos provar aqui permite casos em que . Estes são por exemplo, os casos quando está correlacionada com . Cf. Econometria: Sessão de Revisão do Exame de Honra (PDF) , p. 7)
A suposição de mínimos quadrados é a seguinte.
As distribuições conjuntas de , são iid, onde é o -ésimo elemento em e onde e são os vetores de linha em e .
Grandes valores atípicos é improvável, ou seja, para cada , e tem finitos quarto momentos, onde é o : th elemento em .
possui uma classificação de coluna completa (ou seja, não há multicolinearidade perfeita; isso garante a inversibilidade de ).
( Premissas estendidas de mínimos quadrados : embora eu ache que isso não seja necessário (e me foi dito que não é), também podemos assumir a homosquasticidade, ou seja, para cada , e que a distribuição condicional de fornecida é normal para cada (ou seja, temos erros normais.))
NOTA SOBRE TERMINOLOGIA
Em , a suposição Condial Mean Zero é a suposição de que . A suposição Condicional da Independência Média, no entanto, é a suposição de que .
Essa terminologia é usada, por exemplo, em Introdução à Econometria, 3ª ed. por James H. Stock e Mark W. Watson, p. 281; e Econometria Analysis of Cross Section and Panel Data, 1ª ed. por Jeffrey M. Wooldridge, p. 607. Consulte também Restrições de independência condicional: teste e estimativa para discussões semelhantes.
PENSAMENTOS ADICIONAIS E SUBSTITUIÇÃO 2
Penso que, contrariamente a James H. Stock e Mark W. Watson, a independência média condicional não garante uma estimativa imparcial de da OLS . Isso ocorre porque pode assumir formas não lineares como que é um polinômio em ou onde é algum parâmetro ainda a ser estimado (aqui estou usando a exponencial da matriz ) e, então, acho que a regressão não linear deve ser aplicada, o que geralmente nos deixa com estimativas tendenciosas. Além disso, a estimativa de OLS em (1) de pode nem coincidir com a estimativa de OLS de( 4 ) E ( U | Z )em se assume certas formas não lineares. (Psicologicamente, também acho que a afirmação feita no livro de Stock & Watson é boa demais para ser verdadeira.)
Assim, uma pergunta adicional é se existe algum contraexemplo à proposição de que a independência média condicional leva a uma estimativa OLS imparcial?
SUBQUERY 3
Em Econometrics principalmente inofensivos, Angrist & Pischke argumentam na subseção 3.3, p. 68--91, que sob independência condicional (IC), ou seja, sendo independente de dado (que é uma condição mais forte, eu acho, do que a suposição de independência média condicional dada acima), existe uma conexão estreita entre estimativas correspondentes de o efeito de em e os coeficientes em na regressão de em e que motiva que, sob CI, a estimativa OLS do coeficiente em em é menos tendencioso do que se o IC não se mantiver (tudo o resto é igual).
Agora, essa idéia pode de alguma forma ser usada para responder à minha pergunta principal aqui?