É possível executar uma regressão em que você possui uma variável de recurso desconhecida / desconhecida?


7

É possível executar uma regressão em que você possui uma variável de recurso desconhecida / desconhecida?

Diga que eu tenho yn=a0+a1x1+a2x2+a3x3 mas eu não / não posso medir o valor da variável do recurso x3. Ainda posso realizar uma regressão para verificar os coeficientesai?

Que tal se eu tiver algum conhecimento das estatísticas de como x3é distribuído? Se eu souber dissox3 é extraído de uma distribuição gaussiana N(0,σ2), com conhecidos σ isso me permite executar a regressão para verificar os valores de ai?


4
Não, como você saberia o que é atribuível ao recurso e o que é aleatório?
user2974951

7
Se fosse possível, o mundo seria lindo! Imagine: sem coleta de dados! sem disputas de dados! Ninguém lhe enviando dados como imagem embeded no documento do Word ...
Łukasz Deryło

Obrigado pelas respostas, só queria alguma confirmação de que era esse o caso, como eu suspeitava. Acho que ainda é possível realizar a regressão nas outras variáveis ​​de recurso se o efeito dex3era muito fraco em relação às outras variáveis ​​de recurso e, portanto, poderia ser totalmente negligenciado, mas no caso em que há uma grande contribuição, a regressão é impossível.
SomeRandomPhysicist

@ user2974951 Por que não transformar isso em resposta? Eu nem acho que você precisaria expandir isso.
mkt - Restabelece Monica

Que tal um modelo de espaço de estado?
Chris Haug

Respostas:


13

A fórmula completa para um modelo linear é (na forma de quase matriz)

Y=βX+ϵ

Portanto, temos vários coeficientes para as variáveis ​​que estamos controlando e, em seguida, temos ϵ, que é tudo o mais que não explicamos com nossas variáveis ​​incluídas.

Nesse termo de erro, pertencem todas as variáveis ​​que não consideramos, porque não temos informações para elas ou porque simplesmente não as conhecemos (desvio aleatório).

Portanto, não há como você saber o que neste termo pertence ao termo desconhecido.


11
Promovido pela excelência e clareza da resposta.
James Phillips

3

Que tal se eu tiver algum conhecimento das estatísticas de como o x3 é distribuído?

Se você fizer a regressão de y em x1 e x2, se você deseja adivinhar como x3 se correlaciona com cada uma delas, é possível calcular o que essas suposições implicariam para como os coeficientes estimados mudariam se você pudesse observar x3 e executou a regressão completa.

Suponha, por exemplo, que x3 não está correlacionado com x1. Então

α2,your regression=α2,full regression+α3cov(x3,x2)var(x2)

Então se x3 é provável que esteja apenas fracamente correlacionado com y ou x1 e x2pouco mudaria. E, se for, você pode usar essas fórmulas de viés de variável omitida para prever como as coisas mudariam.


0

É sempre possível ... mas suas estimativas serão tendenciosas em muitos casos. O caso mais favorável ocorre:
(a) quandox3n não está correlacionado com os outros regressores, neste caso, regride yn em (ι,x1,x2) e você tem estimativas imparciais de a0,a1,a2(Teorema de Frish-Waugh-Lovell)
(b) Se, além de (a) você sabeσ e x3N(0,σ2), você pode até identificar a3: desenhar N valores de iid para x3nN(0,σ2) e regredir yn em (ι,x1,x2,x3).


Você poderia explicar melhor como executar a regressão na situação (b)? Você gera valores para o desconhecidox3 desenhando-os de N(0,σ2)e depois regredir nisso?
SomeRandomPhysicist

Sim, é assim que se faz. É possível iterar na geração e estimativa aleatória de números, mas isso não parece interessante no seu caso simples. Existe uma literatura crescente sobre métodos baseados em simulação usando uma abordagem semelhante, mas eles são um pouco mais envolvidos do que no seu exemplo: veja Gouriéroux e Monfort, por exemplo. Veja também a descrição pedagógica no texbook de Cameron e Trivedi (2005).
Bertrand
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.