Seleção de modelo não aninhado


13

O teste da razão de verossimilhança e a AIC são ferramentas para escolher entre dois modelos e ambos se baseiam na probabilidade de log.

Mas, por que o teste da razão de verossimilhança não pode ser usado para escolher entre dois modelos não aninhados enquanto o AIC pode?


O próprio Akaike achou que o AIC era útil para comparar modelos não aninhados. Veja a citação dele que referenciei em resposta ao post aqui .
JonesBC

Respostas:


18

O teste LR (razão de verossimilhança) na verdade está testando a hipótese de que um subconjunto especificado dos parâmetros seja igual a alguns valores pré-especificados. No caso de seleção de modelo, geralmente (mas nem sempre) isso significa que alguns dos parâmetros são iguais a zero. Se os modelos estiverem aninhados, os parâmetros no modelo maior que não estão no modelo menor são os que estão sendo testados, com valores especificados implicitamente por sua exclusão do modelo menor. Se os modelos não estão aninhados, você não está mais testando isso, porque AMBOS os modelos têm parâmetros que não estão no outro modelo, portanto, a estatística do teste LR não possui a assintóticaχ2 distribuição que (normalmente) faz no caso aninhado.

AIC, por outro lado, não é usado para testes formais. É usado para comparações informais de modelos com diferentes números de parâmetros. O termo de penalidade na expressão para AIC é o que permite essa comparação. Mas nenhuma suposição é feita sobre a forma funcional da distribuição assintótica das diferenças entre a AIC de dois modelos não aninhados ao fazer a comparação do modelo, e a diferença entre duas AICs não é tratada como uma estatística de teste.

Acrescentarei que há alguma discordância sobre o uso da AIC com modelos não aninhados, pois a teoria é elaborada para modelos aninhados. Daí minha ênfase em "não ... formal" e "não ... estatística de teste". Eu o uso para modelos não aninhados, mas não de maneira rígida e rápida, mais como uma entrada importante, mas não única, no processo de construção do modelo.


@Carl - a elaboração está nos dois comentários imediatamente anteriores ao comentário que você cita. Eu acho que você deve seguir o conselho de Gung - faça uma pergunta e responda. É uma coisa justa a se fazer nessas circunstâncias, e outros fizeram o mesmo por "perguntas de referência". Tendo acabado de analisar sua resposta, eu a votaria.
jbowman

Eu segui o conselho e nova pergunta e resposta estão aqui . BTW, votei sua pergunta (e a resposta aceita) porque me fez pensar, e não porque concordo totalmente com ela. Meu problema é que a suposição de que modelos não aninhados podem ser comparados pelo AIC só é verdadeira quando muitas outras condições geralmente ignoradas são atendidas.
Carl

9

A derivação do AIC como estimador da perda de informações de Kullback-Leibler não faz suposições de modelos sendo aninhados.


1
Mas Akaike assumiu que os modelos estavam sendo construídos com os mesmos dados.
Dwin
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.