A idéia básica da regressão quantílica vem do fato de o analista estar interessado na distribuição de dados, e não apenas na média dos dados. Vamos começar com a média.
A regressão média ajusta uma linha da forma de à média dos dados. Em outras palavras, E ( Y | X = x ) = x β . Uma abordagem geral para estimar esta linha está usando o método dos mínimos quadrados, arg min β ( y - x β ) ′ ( yy= XβE( Y| X= x ) = x β .argminβ( y- x β)′( y- Xβ)
Por outro lado, a regressão mediana procura uma linha que espera que metade dos dados esteja em lados opostos. Nesse caso, a função alvo é Ondeargminβ| y- Xβ|é a primeira norma.| . |
Estendendo a idéia de mediana para resultados quantis em regressão quantílica. A idéia por trás disso é encontrar uma linha em que percentagem de dados esteja além disso.α
Aqui você cometeu um pequeno erro: a regressão Q não é como encontrar um quantil de dados e ajustar uma linha a esse subconjunto (ou até as fronteiras que são mais desafiadoras).
A regressão Q procura uma linha que divide os dados em um qroup a quantil e o restante . Função de destino, dizendo função de verificação de Q-regressão é
β alfa = arg min β { alfa | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | I ( y < X β ) } .α
β^α= argminβ{ α| y- Xβ| Eu( y> Xβ) + ( 1 - α ) | y- Xβ| Eu( y< Xβ) } .
Como você vê, essa função inteligente de destino nada mais é do que traduzir quantil para um problema de otimização.
Além disso, como você vê, a regressão Q é definida para um determinado número ( βα ) e, em seguida, pode ser estendida para encontrar todos os quantis. Em outras palavras, a regressão Q pode reproduzir a distribuição (condicional) da resposta.