Para simplificar, suponha que você tenha uma variável dependente contínua Y e uma variável preditora contínua X.
Regressão logística
Se eu entendo seu post corretamente, sua regressão logística categorizará Y em 0 e 1 com base no quantil da distribuição (incondicional) de Y. Especificamente, o q-ésil quantil da distribuição dos valores Y observados será computado e Ycat será seja definido como 0 se Y for estritamente menor que esse quantil e 1 se Y for maior que ou igual a esse quantil.
Se o exposto acima captar sua intenção, a regressão logística modelará as chances de Y exceder ou ser igual ao q-ésil quantil (observado) da distribuição Y (incondicional) em função de X.
Regressão quantílica
Por outro lado, se você estiver executando uma regressão quantílica de Y em X, estará focando na modelagem de como o q-ésil quantil da distribuição condicional de Y, dado X, muda em função de X.
Regressão logística versus regressão quantílica
Parece-me que esses dois procedimentos têm objetivos totalmente diferentes, uma vez que o primeiro procedimento (ou seja, regressão logística) se concentra no q-ésil quantil da distribuição incondicional de Y, enquanto o segundo procedimento (ou seja, regressão quantil) se concentra no o q-ésil quantil da distribuição condicional de Y.
The unconditional distribution of Y is the
distribution of Y values (hence it ignores any
information about the X values).
The conditional distribution of Y given X is the
distribution of those Y values for which the values
of X are the same.
Exemplo ilustrativo
Para fins ilustrativos, digamos Y = colesterol e X = peso corporal.
Então, a regressão logística está modelando as chances de ter um valor 'alto' de colesterol (ou seja, maior ou igual ao q-ésimo quantil dos valores observados de colesterol) em função do peso corporal, onde a definição de 'alto' não tem relação ao peso corporal. Em outras palavras, o marcador para o que constitui um valor 'alto' de colesterol é independente do peso corporal. O que muda com o peso corporal neste modelo são as chances de um valor de colesterol exceder esse marcador.
Por outro lado, a regressão quantílica está analisando como os valores do colesterol 'marcador' para os quais q% dos indivíduos com o mesmo peso corporal na população subjacente têm um valor mais alto de colesterol variam em função do peso corporal. Você pode pensar nesses valores de colesterol como marcadores para identificar quais valores de colesterol são 'altos' - mas, neste caso, cada marcador depende do peso corporal correspondente; além disso, presume-se que os marcadores mudem de maneira previsível à medida que o valor de X muda (por exemplo, os marcadores tendem a aumentar à medida que X aumenta).