Interpretação de preditores transformados em log em regressão logística


15

Um dos preditores no meu modelo logístico foi transformado em log. Como você interpreta o coeficiente estimado do preditor transformado em log e como calcula o impacto desse preditor no odds ratio?



1
Um tratamento muito clara, abrangente desta questão é a resposta de jthetzel em stats.stackexchange.com/questions/18480/...
rolando2

Obrigado por toda sua ajuda. Mais um esclarecimento. Na verdade, se eu mudar para o log base 2-, de acordo com a resposta anterior, faz sentido intuitivo que uma duplicação no preditor resulte em uma mudança de% de% no resultado.
Mp77

Respostas:


16

Se você exponenciar o coeficiente estimado, obterá uma razão de chances associada a um aumento de vezesb no preditor, em que é a base do logaritmo usado ao transformar o preditor em log.b

Normalmente, escolho levar os logaritmos para a base 2 nessa situação, para poder interceptar o coeficiente exponencial como uma razão de chances associada a uma duplicação do preditor.


3
Interessante. Eu sempre uso logs naturais porque muitos dos coeficientes tendem a ser próximos de zero e, em seguida, podem ser interpretados como diferenças proporcionais (relativas). Isso não é possível em nenhuma outra base de logaritmo. Vejo algum mérito em usar outras bases, mas acho que você precisa esclarecer sua resposta, porque prima facie sua interpretação não usa o valor do coeficiente!
whuber

@whuber desculpe o que significa prima facie ? Primeira cara ??
onestop 16/03


8

@gung é completamente correto, mas, no caso de você não decidir mantê-lo, você pode interpretar o coeficiente tem de ter um efeito sobre cada múltiplo do IV, em vez de cada adição do IV.

Um IV que freqüentemente deve ser transformado é a renda. Se você incluísse o valor não transformado, cada (digamos) aumento de $ 1.000 na renda teria um efeito no quociente de probabilidade, conforme especificado pelo quociente de chance. Por outro lado, se você anotasse o log (10) da receita, cada aumento de 10 vezes na receita teria o efeito sobre o odds ratio especificado no odds ratio.

Faz sentido fazer isso pela renda porque, de várias maneiras, um aumento de US $ 1.000 na renda é muito maior para quem ganha US $ 10.000 por ano do que alguém que ganha US $ 100.000.

Uma observação final - embora a regressão logística não faça suposições de normalidade, mesmo a regressão OLS não faz suposições sobre as variáveis, faz suposições sobre o erro, conforme estimado pelos resíduos.


1
+1, bons pontos. Suponho que poderia ter sido mais completo. Além disso, desliguei o mathjax inadvertido colocando uma barra invertida "\" imediatamente antes dos cifrões. Espero que você não se importe.
gung - Restabelece Monica

O que você quer dizer com 'regressão logística assume pressupostos sobre os erros'?

Não, a regressão OLS faz suposições sobre os erros. Foi o que eu disse.
Peter Flom - Restabelece Monica

3

Esta resposta é adaptada de The Statistical Sleuth, de Fred L. Ramsey e Daniel W. Schafer.

Se a sua equação do modelo for:

log(p/(1p))=β0+βlog(X)

kXkβ

Por exemplo, eu tenho o seguinte modelo de presença de escaras regredidas no tempo de permanência em um hospital.

log(oddsofbedsore)=.44+0.45(lengthofstay)

β=0.45

k

k=2

kβ=20.45=1.37

k=2

k=0.5

kβ=0.50.45=0.73

k=0.5

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.