Interpretando a probabilidade do log


9

Tenho dificuldade em interpretar alguns resultados. Estou fazendo uma regressão hierárquica relacionada ecoreg. Se eu digitar o código, receberei resultados com odds ratio, ratio de confiança e uma probabilidade de log maximizada 2x.

No entanto, não entendo completamente como interpretar a probabilidade de log maximizada 2x. Tanto quanto sei, a probabilidade de log é usada como uma maneira conveniente de calcular uma probabilidade e calcula o valor dos parâmetros com base nos resultados. Mas não entendo se um valor maior ou menor é melhor. Eu olhei para várias fontes online, por exemplo , /programming/2343093/what-is-log-likelihood , mas ainda estou emperrado.

Abaixo o resultado que recebo:

Call:
eco(formula = cbind(y, N) ~ deprivation + meanIncome, binary = ~fracSmoke + 
    soclass, data = dfAggPlus, cross = cross)

Aggregate-level odds ratios: 
                   OR        l95        u95
(Intercept) 0.0510475 0.03837276 0.06790878
deprivation 0.9859936 0.88421991 1.09948134
meanIncome  1.0689951 0.95574925 1.19565924

Individual-level odds ratios:
                OR       l95      u95
fracSmoke 3.124053 2.0761956 4.700765
soclass   1.001050 0.9930815 1.009083

-2 x log-likelihood:  237.4882 

Então, como devo interpretar um valor de 237.4882 em comparação com um resultado de 206 ou 1083? A ajuda é muito apreciada!


O que exatamente não está claro para você?
Tim

Bem, quero entender se uma maior probabilidade de log significa que o resultado é mais confiável ou, por exemplo, menos confiável. Além disso, eu quero saber como eu deveria interpretar as diferenças entre vários resultados (por exemplo, 206 237 ou 1083)
Keizer

Possível duplicata da estimativa
Tim

Marquei sua pergunta como uma duplicata de outra pergunta mais geral que pergunta qual é a estimativa de probabilidade máxima - verifique.
Tim

Parece que é usado como um desvio. Veja < en.wikipedia.org/wiki/Deviance_information_criterion >
pglpm

Respostas:


0

Para obter pelo menos algum significado da probabilidade L, lembre-se de que, para corrigir a contagem de amostras N, a probabilidade máxima de log para um determinado modelo de distribuição depende principalmente da escala. Para determinada variação, a distribuição normal tem o valor mais alto. Para ter uma ideia, dividiria o logL por N e, talvez, também fizesse uma correção de escala. Se seus dados se ajustarem melhor a uma distribuição uniforme, seria melhor usar a probabilidade uniforme como função máxima de entropia para determinado intervalo como um tipo de referência. Outro valor de referência geral pode ser o caso contínuo de usar um ajuste do KDE e calcular o L para isso. No entanto, o que você faz L é mais difícil de interpretar do que, por exemplo, o valor KS ou o erro rms.
Se você pegar outro modelo e obter um L maior, isso não significa que o modelo seja melhor, porque talvez você esteja em uma situação de sobreajuste. Para incluir isso, use o valor AIC. Aqui menor é melhor e, novamente, você pode usar uma distribuição normal como "referência".

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.