Não, não é apenas uma heurística.
A regressão logística é um caso particular de um modelo linear generalizado (GLM), neste caso para um processo em que a variável de resposta é condicionalmente Bernoulli (ou, mais geralmente, binomial ).
Um GLM inclui uma especificação de um modelo para a média condicional da resposta. No caso de uma variável de Bernoulli, sua média condicional é o parâmetro , que é explicitamente a probabilidade de a resposta ser . É modelado em termos de um ou mais preditores. Aqui está o modelo para a média de um único preditor, :pEuYEu1 1xEu
P(YEu= 1 |xEu) =exp(β0 0+β1 1xEu)1 + exp(β0 0+β1 1xEu)
Portanto, é (intencionalmente) um modelo para a probabilidade de que a resposta seja , dado o valor dos preditores.1 1
A forma da função de link (e seu inverso ) também não é acidental - o link logit (que é o que faz com que a regressão logística) seja a função natural (ou canônica ) do link para uma resposta binomial. Outras opções de função de link são possíveis (e elas também serão modelos para a probabilidade de 1). Outras opções comuns para uma resposta binomial são o probit e o log-log complementar, mas a logística é de longe a mais comum.η= log( p / ( 1 - p ) )p = exp( η) / ( 1 + exp( η) )