interpretação de estimativas de regressão logística cloglog


21

Alguém poderia me aconselhar sobre como interpretar as estimativas de uma regressão logística usando um link cloglog?

Eu instalei o seguinte modelo em lme4:

glm(cbind(dead, live) ~ time + factor(temp) * biomass,
    data=mussel, family=binomial(link=cloglog))

Por exemplo, a estimativa de tempo é 0,015. É correto dizer que as chances de mortalidade por unidade de tempo são multiplicadas por exp (0,015) = 1,015113 (~ 1,5% de aumento por unidade de tempo).
Em outras palavras, as estimativas obtidas em um cloglog são expressas em probabilidades de log, como é o caso de uma regressão logística de logit?


Edite o código para seguir as Rregras de sintaxe. Você não pode ter (depois de '
Frank Harrell 16/06

Edite a postagem original e exclua o comentário.
Frank Harrell

Respostas:


30

Com uma função de link complementar de log-log, não é regressão logística - o termo "logística" implica um link de logit. Ainda é uma regressão binomial, é claro.

a estimativa de tempo é 0,015. É correto dizer que as chances de mortalidade por unidade de tempo são multiplicadas por exp (0,015) = 1,015113 (~ 1,5% de aumento por unidade de tempo)

Não, porque não é modelado em termos de log-odds. Isso é o que você teria com um link de logit; se você deseja um modelo que funcione em termos de probabilidades de log, use um link logit.

A função de link complementar-log-log diz que

η(x)=log(log(1πx))=xβ

onde .πx=P(Y=1|X=x)

Então não é a razão de chances; de fato .exp(η)exp(η)=log(1πx)

Portanto e . Como resultado, se você precisar de um índice de chances para algum , poderá calcular um, mas os parâmetros não terão uma interpretação simples direta em termos de contribuição para o log-odds.exp(exp(η))=(1πx)1exp(exp(η))=πxx

Em vez disso (sem surpresa), um parâmetro mostra (para uma alteração de unidade em ) a contribuição para o log-log-complementar.x


Como Ben gentilmente sugeriu em sua pergunta nos comentários:

é verdade dizer que a probabilidade de mortalidade por unidade de tempo (ou seja, o perigo) aumenta em 1,5%?

Os parâmetros no modelo complementar de log-log têm uma interpretação clara em termos de taxa de risco. Nós temos que:

eη(x)=log(1πx)=log(Sx) , em que é a função de sobrevivência.S

(Portanto, a sobrevivência do log cairá cerca de 1,5% por unidade de tempo no exemplo.)

Agora, o perigo, , de fato parece que no exemplo dado na pergunta, a probabilidade de mortalidade * por unidade de tempo é aumentada em cerca de 1,5%h(x)=ddxlog(Sx)=ddxeη(x)

* (ou para modelos binomiais com link de cloglog em geral, de )P(Y=1)


7
é verdade dizer que a probabilidade de mortalidade por unidade de tempo (ou seja, o perigo) aumenta em 1,5%?
Ben Bolker
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.