O caso do "viés de atenuação" pode ser apresentado com mais clareza se examinarmos o modelo "probit" - mas o resultado também é transferido para a regressão logística.
Sob os modelos de probabilidade condicional (modelos de logística (logit), "probit" e "probabilidade linear"), podemos postular um modelo de regressão linear latente (não observável):
y∗=Xβ+u
onde é uma variável inobservável contínua (e X é a matriz regressora). O termo de erro é considerado independente dos regressores e segue uma distribuição que tem uma densidade simétrica em torno de zero e, no nosso caso, a distribuição normal padrão F U ( u ) = Φ ( u ) .y∗XFU(u)=Φ(u)
Assumimos que o que observamos, ou seja, a variável binária , é uma função Indicadora do inobservável y ∗ :yy∗
y=1ify∗>0,y=0ify∗≤0
Então perguntamos "qual é a probabilidade de assumir o valor 1 dado os regressores?" (ou seja, estamos olhando para uma probabilidade condicional). Isto éy1
P(y=1∣X)=P(y∗>0∣X)=P(Xβ+u>0∣X)=P(u>−Xβ∣X)=1−Φ(−Xβ)=Φ(Xβ)
a última igualdade devido à propriedade "reflexiva" da função de distribuição cumulativa padrão, que vem da simetria da função de densidade em torno de zero. Observe que, embora tenhamos assumido que é independente de X , é necessário condicionar X para tratar a quantidade X β como não aleatória.uXXXβ
Se assumirmos que , obtemos o modelo teóricoXβ=b0+b1X1+b2X2
P(y=1∣X)=Φ(b0+b1X1+b2X2)(1)
Vamos agora seja independente de X 1 e erroneamente excluídos a partir da especificação da regressão subjacente. Então especificamosX2X1
Suponha ainda que X 2 também seja uma variável aleatória normal X 2 ∼ N ( μ 2 , σ 2 2 ) . Mas isso significa que
y∗=b0+b1X1+ϵ
X2X2∼N(μ2,σ22)
ϵ=u+b2X2∼N(b2μ2,1+b22σ22)
devido ao fechamento sob adição da distribuição normal (e ao pressuposto de independência). Aplicando a mesma lógica de antes, aqui temos
P(y=1∣X1)=P(y∗>0∣X1)=P(b0+b1X1+ϵ>0∣X1)=P(ϵ>−b0−b1X1∣X1)
ϵ
P(y=1∣X1)=1−P⎛⎝⎜ϵ−b2μ21+b22σ22−−−−−−−√≤−(b0+b2μ2)1+b22σ22−−−−−−−√−b11+b22σ22−−−−−−−√X1∣X1⎞⎠⎟
⇒P(y=1∣X1)=Φ⎛⎝⎜(b0+b2μ2)1+b22σ22−−−−−−−√+b11+b22σ22−−−−−−−√X1⎞⎠⎟(2)
(1)(2)
b1
b^1→pb11+b22σ22−−−−−−−√⟹|b^1|<|b1|
que é o resultado de "desvio para zero".
ϵ