Havia uma pergunta semelhante, há alguns dias, que tinha a referência relevante:
- Belloni, A., Chernozhukov, V. e Hansen, C. (2014) "Inferência sobre os efeitos do tratamento após a seleção entre controles de alta dimensão", Review of Economic Studies, 81 (2), pp. 608-50 ( link )
Pelo menos para mim, o artigo é uma leitura bastante difícil, porque as provas por trás disso relativamente simples são bastante elaboradas. Quando você estiver interessado em estimar um modelo como
yi=αTi+X′iβ+ϵi
onde é o seu resultado, é um efeito de tratamento de interesse e é um vetor de controles em potencial. O parâmetro de destino é . Supondo que a maior parte da variação em seu resultado seja explicada pelo tratamento e um conjunto escasso de controles, Belloni et al. (2014) desenvolvem um método de seleção duplo-robusto que fornece estimativas de pontos corretas e intervalos de confiança válidos. Essa suposição de escarsidade é importante.T i X i αyiTiXiα
Se incluir alguns preditores importantes de mas você não souber quais são (variáveis únicas, seus polinômios de ordem superior ou interações com outras variáveis), você poderá executar um procedimento de seleção em três etapas:y iXiyi
- regress em , suas praças, e as interações, e selecione importantes preditores usando LASSOx iyiXi
- regride em , seus quadrados e interações e selecione preditores importantes usando o LASSOX iTiXi
- regredir em e todas as variáveis que foram selecionadas em uma das duas primeiras etapast iyiTi
Eles fornecem provas de por que isso funciona e por que você obtém os intervalos de confiança corretos etc. com esse método. Eles também mostram que se você executar apenas uma seleção do LASSO na regressão acima e depois regredir o resultado no tratamento e nas variáveis selecionadas, obterá estimativas de pontos erradas e intervalos de confiança falsos, como Björn já disse.
O objetivo de fazer isso é duplo: comparar seu modelo inicial, em que a seleção de variáveis foi guiada por intuição ou teoria, com o modelo de seleção com duplo robusto, fornece uma idéia de quão bom foi o seu primeiro modelo. Talvez seu primeiro modelo tenha esquecido alguns termos importantes ao quadrado ou de interação e, portanto, sofra de forma funcional especificada incorretamente ou de variáveis omitidas. Em segundo lugar, Belloni et al. (2014) pode melhorar a inferência no seu parâmetro de destino porque regressores redundantes foram penalizados em seu procedimento.