Eu tenho um modelo de regressão logística binária com um pseudo-quadrado de McFadden de 0,192 com uma variável dependente chamada pagamento (1 = pagamento e 0 = nenhum pagamento). Qual é a interpretação desse pseudo R-quadrado?
É uma comparação relativa para modelos aninhados (por exemplo, um modelo de 6 variáveis possui um pseudo-quadrado de McFadden de 0,192, enquanto um modelo de 5 variáveis (após remover uma variável do modelo de 6 variáveis acima mencionado), esse modelo de 5 variáveis tem um pseudo R -squared of 0.131. Nós gostaríamos de manter essa sexta variável no modelo?) ou é uma quantidade absoluta (por exemplo, um determinado modelo que tenha um pseudo-quadrado de McFadden R-quadrado de 0,192 é melhor do que qualquer modelo existente com o pseudo de McFadden R-quadrado de 0,180 (mesmo para modelos não aninhados)? Essas são apenas maneiras possíveis de olhar para o pseudo-quadrado de R de McFadden; no entanto, eu assumo que essas duas visões estão distantes, portanto, a razão pela qual estou fazendo essa pergunta aqui.
Fiz muita pesquisa sobre esse tópico e ainda não encontrei a resposta que estou procurando em termos de capacidade de interpretar o pseudo-quadrado de R $ 0,192 de McFadden. Qualquer insight e / ou referências são muito apreciadas! Antes de responder a essa pergunta, estou ciente de que essa não é a melhor medida para descrever um modelo de regressão logística, mas eu gostaria de ter uma compreensão maior dessa estatística independentemente!