Se tiver mais de duas categorias, sua pergunta sobre a "vantagem" de uma regressão sobre a outra provavelmente não terá sentido se você tentar comparar os parâmetros dos modelos , porque os modelos serão fundamentalmente diferentes:Y
il o g P ( i )P ( n o t i ) = l o g i tEu= L i n e um r c o m b i n a t i o n para cada logística binária de regressão, eEu
iri≠rl o g P ( i )P ( r )= l o g i tEu= L i n e um r c o m b i n a t i o n para cada categoria em regressão logística múltipla, sendo a categoria de referência escolhida ( ).Euri ≠ r
No entanto, se o seu objetivo é apenas para prever a probabilidade de cada categoria qualquer abordagem é justificada, embora eles podem dar diferentes estimativas de probabilidade. A fórmula para estimar uma probabilidade é genérica:Eu
i,j,…,rrexp(logit)=1P′()P′( i ) = e x p ( l o g i tEu)e x p ( l o g i tEu) + e x p ( l o g i tj) + ⋯ + e x p ( l o g i tr) , em que são todas as categorias, e se foi escolhido para ser a referência, seu . Portanto, para logística binária, essa mesma fórmula se torna . A logística multinomial depende da suposição (nem sempre realista) de independência de alternativas irrelevantes, enquanto uma série de previsões logísticas binárias não.eu , j , … , rrexp(logit)=1P′(i)=exp(logiti)exp(logiti)+1
Um tema separado é o que são diferenças técnicas entre regressões logísticas multinomiais e binárias no caso de ser dicotômico . Haverá alguma diferença nos resultados? Na maioria das vezes, na ausência de covariáveis, os resultados serão os mesmos, ainda assim, existem diferenças nos algoritmos e nas opções de saída. Deixe-me apenas citar a Ajuda do SPSS sobre esse problema no SPSS:Y
Os modelos de regressão logística binária podem ser ajustados usando o procedimento de regressão logística ou o procedimento de regressão logística multinomial. Cada procedimento possui opções não disponíveis no outro. Uma distinção teórica importante é que o procedimento de Regressão Logística produz todas as previsões, resíduos, estatísticas de influência e testes de adequação usando dados no nível de caso individual, independentemente de como os dados são inseridos e se o número de padrões covariados é ou não é menor que o número total de casos, enquanto o procedimento de regressão logística multinomial agrega internamente casos para formar subpopulações com padrões de covariáveis idênticos para os preditores, produzindo previsões, resíduos e testes de qualidade de ajuste com base nessas subpopulações.
A regressão logística fornece os seguintes recursos exclusivos:
• Teste de qualidade de ajuste de Hosmer-Lemeshow para o modelo
• Análises passo a passo
• Contrastes para definir a parametrização do modelo
• Pontos de corte alternativos para classificação
• Gráficos de classificação
• Modelo montado em um conjunto de casos em um conjunto de casos retido
• Salva previsões, resíduos e estatísticas de influência
A regressão logística multinomial fornece os seguintes recursos exclusivos:
• Testes qui-quadrado de Pearson e desvio para adequação do modelo
• Especificação de subpopulações para agrupamento de dados para testes de qualidade do ajuste
• Listagem de contagens, contagens previstas e resíduos por subpopulações
• Correção de estimativas de variância para sobre-dispersão
• Matriz de covariância das estimativas de parâmetros
• Testes de combinações lineares de parâmetros
• Especificação explícita de modelos aninhados
• Ajuste de 1 a 1 modelos de regressão logística condicional correspondidos usando variáveis diferenciadas