Qual é a diferença entre regressão quantílica condicional e incondicional?

38

$\tau^{th}$

{\hat{β}}_{Q R} = min_{b} \sum_{Eu = 1}^{n} ρ_{τ} (y_{Eu} - X_{Eu}^{'} b_{τ})

$\widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau (y_i - X'_i b_\tau)$

ρ_{τ} = u_{i} \cdot (τ - 1 (u_{i} < 0))

$\rho_\tau = u_i\cdot (\tau - 1(u_i<0))$

u_{i}

$u_i$ .

Em um artigo de Firpo et al. (2009) , os autores afirmam que a regressão quantílica condicional não produz efeitos interessantes. Eles dizem que os resultados condicionais não podem ser generalizados para a população (no OLS sempre podemos passar de condicional para incondicional através da lei das expectativas iteradas, mas isso não está disponível para quantis). Isso ocorre porque o quantil incondicional pode não ser o mesmo que o quantil condicional . $\tau^{th}$ $y_i$ $\tau^{th}$ $y_i |X_i$

Se bem entendi, parte do problema é que as covariáveis incluídas no afetam a variável de classificação porque a inclusão de covariáveis divide o erro em componentes observados e não observados. Eu simplesmente não consigo entender por que isso causa problemas. $X_i$ $u_i$

Aqui estão as minhas perguntas:

O que diferencia os efeitos quantílicos condicionais e incondicionais um do outro?
Como posso interpretar os coeficientes das regressões quantílicas condicionais?
As regressões quantílicas condicionais são tendenciosas?

Referências:

Koenker, R. & Bassett, G. (1978) "Regression Quantiles", Econometrica , vol. 46 (1), pp. 33-50.
Firpo, S. et al. (2009) "Regressões Quantílicas Incondicionais", Econometrica , vol. 77 (3), pp. 953-973.

quantile-regression

— AlexH
fonte

1

Eu recomendo que você verifique o capítulo 7 de "Econometria principalmente inofensiva" de Angrist e Pischke. Ele tem alguns exemplos de interpretação do coeficiente de regressão quantílica e das implicações dos quantis serem condicionais a X. Concordo com você que essas implicações não são invalidantes para o uso do modelo, a menos que você esteja procurando isolar o impacto de uma covariável. Eu acho que regressões quantílicas também podem ser tendenciosas; Angrist e Pischke exploram alguns métodos propostos para controlar variáveis omitidas, por exemplo.

— Juan C

1

Não é uma resposta, mas talvez uma regressão de pista - quantil possa ser lançada como um problema de "dados ausentes", em que os dados ausentes são os pesos usados na regressão OLS ponderada. Por exemplo, o uso da distribuição exponencial para o peso inverso fornece regressão mediana ( ).

τ = 50

$\tau=50$

— probabilityislogic

29

Configuração
Suponha que você tenha uma regressão simples da forma que o resultado é o log de ganhos da pessoa , é o número de anos de escolaridade e é um termo de erro. Em vez de apenas observar o efeito médio da educação sobre os ganhos, que você obteria via OLS, também deseja ver o efeito em diferentes partes da distribuição de resultados.

\ln y_{i} = α + β S_{i} + ϵ_{i}

$\ln y_i = \alpha + \beta S_i + \epsilon_i$

i

$i$

S_{i}

$S_i$

ϵ_{i}

$\epsilon_i$

1) Qual é a diferença entre a configuração condicional e incondicional
Primeiro, plote os ganhos de log e vamos escolher dois indivíduos, e , onde está na parte inferior da distribuição de ganhos incondicionais e na parte superior. $A$ $B$ $A$ $B$ insira a descrição da imagem aqui

Não parece extremamente normal, mas é porque eu usei apenas 200 observações na simulação, então não se importe com isso. Agora, o que acontece se condicionarmos nossos ganhos em anos de educação? Para cada nível de educação, você obteria uma distribuição de ganhos "condicional", ou seja, criaria um gráfico de densidade conforme acima, mas para cada nível de educação separadamente.

insira a descrição da imagem aqui

$A$ $B$ $A$

Portanto, uma vez que você condiciona outra variável, agora aconteceu que uma pessoa está agora na parte superior da distribuição condicional, enquanto essa pessoa estaria na parte inferior da distribuição incondicional - é isso que altera a interpretação dos coeficientes de regressão quantílica . Por quê?

$E[y_i|S_i] = E[y_i]$ $Q_{\tau}(y_i|S_i) \neq Q_{\tau}(y_i)$ $\tau$ . Isso pode ser resolvido executando primeiro a regressão quantílica condicional e depois integrando as variáveis de condicionamento para obter o efeito marginalizado (o efeito incondicional) que você pode interpretar como no OLS. Um exemplo dessa abordagem é fornecido por Powell (2014) .

2) Como interpretar os coeficientes de regressão quantílica?
Esta é a parte complicada e eu não pretendo possuir todo o conhecimento do mundo sobre isso, então talvez alguém tenha uma explicação melhor para isso. Como você viu, a classificação de um indivíduo na distribuição de ganhos pode ser muito diferente, considerando a distribuição condicional ou incondicional.

$\beta_{90} = 0.13$

Para regressão quantílica incondicional
Esses são os coeficientes OLS que você costuma interpretar. A dificuldade aqui não é a interpretação, mas como obter esses coeficientes que nem sempre são fáceis (a integração pode não funcionar, por exemplo, com dados muito escassos). Outras maneiras de marginalizar os coeficientes de regressão quantílica estão disponíveis, como o método de Firpo (2009), usando a função de influência recente. O livro de Angrist e Pischke (2009) mencionado nos comentários afirma que a marginalização dos coeficientes de regressão quantílica ainda é um campo ativo de pesquisa em econometria - embora, tanto quanto eu saiba, a maioria das pessoas hoje em dia se comprometa com o método de integração (um exemplo seria Melly e Santangelo (2015), que o aplicam ao modelo Alterações em alterações).

3) Os coeficientes de regressão quantílica condicional são enviesados? Não (supondo que você tenha um modelo especificado corretamente), eles apenas medem algo diferente pelo qual você pode ou não estar interessado. Um efeito estimado em uma distribuição e não em indivíduos é como eu disse não muito interessante - na maioria das vezes. Para dar um exemplo contrário: considere um formulador de políticas que introduza um ano adicional de escolaridade obrigatória e eles querem saber se isso reduz a desigualdade de renda na população.

$\beta_{\tau}$ $\beta_{10} = \beta_{90} = 0.8$

Quando o efeito do tratamento quantil NÃO for constante (como nos dois painéis inferiores), você também terá um efeito de escala além do efeito de localização. Neste exemplo, a parte inferior da distribuição de ganhos aumenta mais que a parte superior, de modo que o diferencial 90-10 (uma medida padrão da desigualdade de ganhos) diminui na população. insira a descrição da imagem aqui

Você não sabe quais indivíduos se beneficiam dele ou em que parte da distribuição são iniciados no final (para responder a essa pergunta, você precisa dos coeficientes de regressão incondicional do quantil). Talvez essa política os prejudique e os coloque em uma parte ainda mais baixa em relação aos outros, mas se o objetivo era saber se um ano adicional de educação obrigatória reduz o spread de ganhos, isso é informativo. Um exemplo dessa abordagem é Brunello et al. (2009) .

Se você ainda está interessado no viés das regressões quantílicas devido a fontes de endogeneidade, dê uma olhada em Angrist et al (2006), onde eles derivam uma fórmula de viés variável omitida para o contexto quantil.

— Andy
fonte

1

Existe atualmente uma implementação R dessa técnica?

— Chandler

1

Além da excelente resposta fornecida por @Andy. Você pode querer conferir:

Borah, BJ e Basu, A. (2013). "Destacando as diferenças entre as abordagens de regressão quantílica condicional e incondicional através de um aplicativo para avaliar a adesão à medicação." Health Economics, 22 (9), 1052-1070. http://doi.org/10.1002/hec.2927

— JustGettinStarted
fonte