Alternativas ao modelo de logon multinomial

Estou tentando estimar um modelo de escolha ocupacional com três opções. Existem alternativas ao uso da regressão logística multinomial ao lidar com esses resultados categóricos não ordenados?

Ao lidar com variáveis dependentes binárias, parece haver várias opções, como o modelo LPM, bem como o modelo probit e logit binário. Ao lidar com variáveis categóricas não ordenadas, a literatura continua recomendando o modelo de logit multinomial sem compará-lo com alternativas.

— Thor
fonte

Você está apenas perguntando se existem funções alternativas de link (além do logit) disponíveis para o caso multinomial? Ou você está perguntando sobre diferentes tipos de modelos (como modelos de carrinho )? Ou talvez algo mais? (Nota lateral, se a primeira, pode ajudar você a ler minha resposta aqui: diferença entre modelos de logit e probit , para obter informações gerais sobre esse problema, embora ele tenha sido escrito em um contexto um pouco diferente.)

— gung - Reinstale Monica

Muito obrigado pelo comentário. Definitivamente vou ler no link. Eu me pergunto principalmente se existe alguma alternativa que use a regressão linear comum (OLS) para lidar com resultados categóricos não ordenados. Você conhece alguma dessas alternativas? Quando se trata de resultados binários, parece haver uma discussão completa sobre o uso de OLS ou modelos binários de logit / probit.

— Thor

Para uma primeira aproximação, o OLS nunca deve ser usado para resultados binários. Tenho certeza de que existem, ou poderiam existir, algoritmos de regressão multinomial que usam funções alternativas de link, mas não sei se os principais softwares os suportam.

— gung - Restabelece Monica

Não sei o que você quer dizer com primeira aproximação (desculpe, eu sou um novato). Mas parece haver alguns economistas de destaque argumentando que o uso de um modelo de LPM funciona bem como o modelo de logit que estimam resultados binários. Pelo menos Angrist e Pischke fazem isso em seu livro 'Econometria principalmente inofensiva' (2009). Você tem alguma dica de onde eu posso ler sobre essas funções de link alternativas? Mais uma vez, obrigado pelo seu feedback!

— Thor

"Para uma primeira aproximação ... nunca ..." significa que 99% das vezes você não deve usar o OLS com um resultado binário. Estou ciente de que há alguns casos em que isso faz menos diferença e que algumas pessoas discordam dos conselhos padrão - é por isso que não disse apenas 'nunca' sem as coberturas. Infelizmente, não conheço um bom lugar para ler sobre o uso de funções de link alternativas com regressão multinomial.

— gung - Restabelece Monica

Respostas:

Há uma variedade de modelos disponíveis para modelar modelos multinomiais.

Recomendo a Cameron & Trivedi Microeconometrics Using Stata para uma introdução fácil e excelente ou dê uma olhada nos slides da palestra de Imbens & Wooldridge ou aqui, disponíveis on-line.

Os modelos amplamente utilizados incluem:

regressão logística multinomial ou mlogit no Stata

logit condicional multinomial (permite incluir facilmente não apenas preditores específicos de indivíduos, mas também específicos de escolhas) ou asclogit no Stata

logit aninhado (relaxe a independência da suposição de alternativas irrelevantes (IIA) agrupando / classificando as opções de maneira hierárquica) ou nlogit no Stata

logit misto (relaxa a suposição IIA assumindo, por exemplo, parâmetros distribuídos normais) ou mixlogit em Stata.

modelo de probit multinomial (pode relaxar ainda mais a suposição IIA, mas você deve ter preditores específicos de escolha disponíveis) logit misto (relaxa a suposição IIA assumindo, por exemplo, parâmetros distribuídos normais), use asmprobit no Stata (mprobit não permite usar preditores específicos de escolha, mas você deve usá-los para relaxar a suposição do IIA )

— Arne Jonas Warnke
fonte

β

$\beta$

Sim, claro, obrigado, consulte a Wikipedia para obter uma explicação: https://en.wikipedia.org/wiki/Mixed_logit

— Arne Jonas Warnke

Se você quer opções bem diferentes de uma regressão logística, pode usar uma rede neural. Por exemplo, o nnetpacote de R tem uma multinomfunção. Ou você pode usar uma floresta aleatória ( randomForestpacote de R e outros). E existem várias outras alternativas de aprendizado de máquina, embora opções como um SVM tendam a não ser bem calibradas, o que torna suas saídas inferiores - na minha opinião - a uma regressão logística.

[Na verdade, um logit provavelmente está sendo usado sob o capô pelos neurônios da rede neural. Portanto, é bem diferente, mas não muito diferente ao mesmo tempo.]

— Wayne
fonte

+1. Apenas para expandir alguns pontos ... Os SVMs podem ser calibrados após o treinamento para produzir boas probabilidades (por exemplo, usando escala de Platt ou regressão isotônica, ao custo de uma etapa extra). Redes neurais com saídas softmax (e qualquer tipo de função de ativação não linear nas camadas ocultas) podem ser consideradas simultaneamente aprendendo um mapeamento não linear em algum espaço de recursos e realizando regressão logística multinomial nesse espaço de recursos.

— User20160

@Wayne; Gostaria de saber que, uma vez que o logit multinomial exige a suposição do IIA; mas sobre a rede neural com ativação softmax? Também requer a mesma suposição?

— ElleryL

Além disso, pense que Redes Neurais (com ativação softmax), Árvores de Decisão (ou Florestas Aleatórias) não exigem que a suposição do IIA seja atendida, considerando a falta de confiabilidade desses testes relacionados à verificação da suposição do IIA. Portanto, isso pode ser uma vantagem em comparação com a logística multinomial se tudo o que estamos preocupados são apenas previsões.

Como alternativa, vários modelos logísticos podem ser construídos para as categorias K-1 com a categoria K como referência. Isso também permite que diferentes preditores sejam conectados a cada uma das equações, em contraste com o multinomial

— SrikanthRaja
fonte

Este é mais um comentário do que uma resposta. Podemos converter sua resposta em um comentário ou você pode estender sua resposta.

— Ferdi

você poderia explicar por que as redes neurais (com ativação softmax) não exigem a suposição de IIA. de acordo com isso, en.wikipedia.org/wiki/Luce%27s_choice_axiom eu pensar Redes Neurais (com activação softmax) tem a mesma restrição

— ElleryL