É claro para mim, e bem explicado em vários sites, quais informações os valores na diagonal da matriz hat fornecem regressão linear.
A matriz hat de um modelo de regressão logística é menos clara para mim. É idêntico à informação que você obtém da matriz hat, aplicando regressão linear? Esta é a definição da matriz de chapéu que encontrei em outro tópico do CV (fonte 1):
com X o vetor de variáveis preditoras e V é uma matriz diagonal com .
Em outras palavras, também é verdade que o valor particular da matriz hat de uma observação também apenas apresenta a posição das covariáveis no espaço covariável e não tem nada a ver com o valor final dessa observação?
Isso está escrito no livro "Análise de dados categóricos" da Agresti:
Quanto maior a alavancagem de uma observação, maior sua potencial influência no ajuste. Como na regressão comum, as alavancas caem entre 0 e 1 e somam o número de parâmetros do modelo. Diferentemente da regressão comum, os valores do chapéu dependem do ajuste e da matriz do modelo, e os pontos com valores preditivos extremos não precisam ter alta alavancagem.
Então, fora dessa definição, parece que não podemos usá-lo como o usamos na regressão linear comum?
Fonte 1: Como calcular a matriz hat para regressão logística em R?