Interpretando exp (B) na regressão logística multinomial


16

Essa é uma pergunta de um iniciante, mas como interpretar um resultado exp (B) de 6.012 em um modelo de regressão logística multinomial?

1) é 6.012-1.0 = 5.012 = aumento de 5012% no risco?

ou

2) 6,012 / (1 + 6,012) = 0,857 = aumento de 85,7% no risco?

Caso ambas as alternativas estejam incorretas, alguém pode mencionar a maneira correta?

Procurei muitos recursos na internet e chego a essas duas alternativas, e não tenho certeza de qual delas está correta.

Respostas:


35

Levamos um tempo para chegar lá, mas, em resumo, uma alteração de uma unidade na variável correspondente a B multiplicará o risco relativo do resultado (comparado ao resultado base) por 6,012.

Pode-se expressar isso como um aumento de "5012%" no risco relativo , mas essa é uma maneira confusa e potencialmente enganosa de fazê-lo, porque sugere que devemos pensar nas mudanças de maneira aditiva, quando, na verdade, o modelo logístico multinomial nos encoraja fortemente a pense multiplicativamente. O modificador "relativo" é essencial, porque uma mudança em uma variável está mudando simultaneamente as probabilidades previstas de todos os resultados, não apenas o em questão, portanto, temos que comparar probabilidades (por meio de proporções, não diferenças).

O restante desta resposta desenvolve a terminologia e a intuição necessárias para interpretar essas declarações corretamente.

fundo

Vamos começar com a regressão logística comum antes de passar para o caso multinomial.

Para a variável dependente (binária) Y e variáveis ​​independentes Xi , o modelo é

Pr[Y=1]=exp(β1X1++βmXm)1+exp(β1X1++βmXm);

equivalentemente, assumindo 0Pr[Y=1]1 ,

log(ρ(X1,,Xm))=logPr[Y=1]Pr[Y=0]=β1X1++βmXm.

(Isso simplesmente define ρ , que é a probabilidade em função do Xi .)

Sem qualquer perda de generalidade, indexe o para que X m seja a variável e β m seja o "B" na pergunta (de modo que exp ( β m ) = 6,012 ). Fixando os valores de X i , 1 i < m , e variando X m por uma pequena quantidade δXiXmβmexp(βm)=6.012Xi,1i<mXmδ produz

log(ρ(,Xm+δ))log(ρ(,Xm))=βmδ.

Assim, é a mudança marginal nas probabilidades logarítmicas em relação a X m .βm Xm

Para recuperar , evidentemente devemos definir δ = 1 e exponenciar o lado esquerdo:exp(βm)δ=1

exp(βm)=exp(βm×1)=exp(log(ρ(,Xm+1))log(ρ(,Xm)))=ρ(,Xm+1)ρ(,Xm).

Isso exibe como a razão de chances para um aumento de uma unidade em X m . Para desenvolver uma intuição para o que isso pode significar, tabule alguns valores para uma variedade de probabilidades iniciais, arredondando fortemente para destacar os padrões:exp(βm)Xm

Starting odds  Ending odds  Starting Pr[Y=1]  Ending Pr[Y=1]
0.0001         0.0006       0.0001            0.0006
0.001          0.006        0.001             0.006
0.01           0.06         0.01              0.057
0.1            0.6          0.091             0.38
1.             6.           0.5               0.9
10.            60.          0.91              1.
100.           600.         0.99              1.

Para probabilidades realmente pequenas , que correspondem a probabilidades realmente pequenas , o efeito de um aumento de uma unidade em é multiplicar as probabilidades ou a probabilidade em cerca de 6,012. O fator multiplicativo diminui à medida que as probabilidades (e probabilidade) aumentam e desapareceu essencialmente quando as probabilidades excedem 10 (a probabilidade excede 0,9).Xm

Ratio change in probability

Como uma alteração aditiva , não há muita diferença entre uma probabilidade de 0,0001 e 0,0006 (é apenas 0,05%), nem há muita diferença entre 0,99 e 1. (apenas 1%). O maior efeito aditivo ocorre quando as probabilidades são iguais a , em que a probabilidade muda de 29% a 71%: uma variação de + 42%.1/6.0120.408

Additive change in probability

Vemos, então, que se expressarmos "risco" como uma razão de chances, = "B" tem uma interpretação simples - a razão de chances é igual a β m para um aumento unitário em X mβmβmXm mas quando expressamos risco em de alguma outra maneira, como uma mudança nas probabilidades, a interpretação requer cuidados para especificar a probabilidade inicial.

Regressão logística multinomial

(Isso foi adicionado como uma edição posterior).

Tendo reconhecido o valor do uso de probabilidades de log para expressar chances, vamos para o caso multinomial. Agora a variável dependente pode ser igual a uma de k 2 categorias, indexadas por i = 1 , 2 , , k . A probabilidade relativa de estar na categoria i éYk2i=1,2,,ki

Pr[Yi]exp(β1(i)X1++βm(i)Xm)

com parâmetros a ser determinado e escrevendo Y i para Pr [ Y = categoria  i ] . Como abreviação, vamos escrever a expressão da direita como p i ( X , β ) ou, onde X e β são claros do contexto, simplesmente p i . A normalização para tornar todas essas probabilidades relativas somadas à unidade dáβj(i)YiPr[Y=category i]pi(X,β)Xβpi

Pr[Yi]=pi(X,β)p1(X,β)++pm(X,β).

(Há uma ambiguidade nos parâmetros: há muitos deles. Convencionalmente, escolhe-se uma categoria "base" para comparação e força todos os seus coeficientes a zero. No entanto, embora seja necessário relatar estimativas únicas dos betas, é não necessário para interpretar os coeficientes para manter a simetria -. isto é, para evitar quaisquer distinções artificiais entre as categorias - não vamos impor qualquer restrição a menos que tenhamos a).

Uma maneira de interpretar esse modelo é solicitar a taxa marginal de mudança das probabilidades logarítmicas para qualquer categoria (por exemplo, categoria ) em relação a qualquer uma das variáveis ​​independentes (por exemplo, X j ). Isto é, quando mudamos X j por um pouco, que induz uma mudança na probabilidade de log de Y i . Estamos interessados ​​na constante de proporcionalidade relacionada a essas duas mudanças. A Regra em Cadeia do Cálculo, junto com um pouco de álgebra, nos diz que essa taxa de mudança éiXjXjYi

 log odds(Yi) Xj=βj(i)βj(1)p1++βj(i1)pi1+βj(i+1)pi+1++βj(k)pkp1++pi1+pi+1++pk.

This has a relatively simple interpretation as the coefficient βj(i) of Xj in the formula for the chance that Y is in category i minus an "adjustment." The adjustment is the probability-weighted average of the coefficients of Xj in all the other categories. The weights are computed using probabilities associated with the current values of the independent variables X. Thus, the marginal change in logs is not necessarily constant: it depends on the probabilities of all the other categories, not just the probability of the category in question (category i).

When there are just k=2 categories, this ought to reduce to ordinary logistic regression. Indeed, the probability weighting does nothing and (choosing i=2) gives simply the difference βj(2)βj(1). Letting category i be the base case reduces this further to βj(2), because we force βj(1)=0. Thus the new interpretation generalizes the old.

To interpret βj(i) directly, then, we will isolate it on one side of the preceding formula, leading to:

The coefficient of Xj for category i equals the marginal change in the log odds of category i with respect to the variable Xj, plus the probability-weighted average of the coefficients of all the other Xj for category i.

Another interpretation, albeit a little less direct, is afforded by (temporarily) setting category i as the base case, thereby making βj(i)=0 for all the independent variables Xj:

The marginal rate of change in the log odds of the base case for variable Xj is the negative of the probability-weighted average of its coefficients for all the other cases.

Actually using these interpretations typically requires extracting the betas and the probabilities from software output and performing the calculations as shown.

Finally, for the exponentiated coefficients, note that the ratio of probabilities among two outcomes (sometimes called the "relative risk" of i compared to i) is

YiYi=pi(X,β)pi(X,β).

Let's increase Xj by one unit to Xj+1. This multiplies pi by exp(βj(i)) and pi by exp(βj(i)), whence the relative risk is multiplied by exp(βj(i))/exp(βj(i)) = exp(βj(i)βj(i)). Taking category i to be the base case reduces this to exp(βj(i)), leading us to say,

The exponentiated coefficient exp(βj(i)) is the amount by which the relative risk Pr[Y=category i]/Pr[Y=base category] is multiplied when variable Xj is increased by one unit.


1
Great explanations, but the OP explicitly asked for the multinomial model. I may be reading more into the question than the OP intended, and the explanation for the binary case may be adequate, but I would love to see this answer cover the general multinomial case too. Even though the parametrization is similar, the "log-odds" are in general with respect to an (arbitrary) reference category, and they are not really log-odds, and a unit change in Xi results in a combined change of these "log-odds", and an increasing "log-odds" does not imply and increasing probability.
NRH

@NRH That's an excellent point. I had somehow read "multivariate" instead of "multinomial." If I get a chance to return to this I will try to flesh out those details. Fortunately the same mode of analysis is effective in finding the correct interpretation.
whuber

@NRH Concluído. Agradeço suas sugestões (ou de qualquer outra pessoa) sobre como tornar a interpretação mais clara ou para interpretações alternativas.
whuber

1
obrigado por escrever isso. A resposta completa é uma referência muito boa.
NRH 28/10/11

1

Try considering this bit of explanation in addition to what @whuber has already written so well. If exp(B) = 6, then the odds ratio associated with an increase of 1 on the predictor in question is 6. In a multinomial context, by "odds ratio" we mean the ratio of these two quantities: a) the odds (not probability, but rather p/[1-p]) of a case taking the value of the dependent variable indicated in the output table in question, and b) the odds of a case taking the reference value of the dependent variable.

You seem to be looking to quantify the probability--rather than odds-- of a case being in one or the other category. To do this you would need to know what probabilities the case "started with" -- i.e., before we assumed the increase of 1 on the predictor in question. Ratios of probabilities will vary case by case, while the ratio of odds connected with an increase of 1 on the predictor stays the same.


"If exp(B) = 6, then the odds ratio associated with an increase of 1 on the predictor in question is 6", if I read @whuber's answer correctly it says that the odds ratio will be multiplied by 6 with an increase of 1 on the predictor. That is, the new odds ratio will not be 6. Or am I intepreting things incorrectly?
rbm

Where you say "the new odds ratio will not be 6" I would say "the new odds will not be 6...but the ratio of the new to the old odds will be 6."
rolando2

Yes, I agree with that! But I just thought that "the odds ratio associated with an increase of 1 on the predictor in question is 6" does not really say that. But maybe I am just misinterpreting it then. Thanks for the clarification!
rbm

1

I was also looking for the same answer, but the once above were not satisfying for me. It seemed to complex for what it really is. So I will give my interpretation, please correct me if I am wrong.

Do however read to the end, since it is important.

First of all the values B and Exp(B) are the once you are looking for. If the B is negative your Exp(B) will be lower than one, which means odds decrease. If higher the Exp(B) will be higher than 1, meaning odds increase. Since you are multiplying by the factor Exp(B).

Unfortunately you are not there yet. Because in a multinominal regression your dependent variable has multiple categories, let's call these categories D1, D2 and D3. Of which your last is the reference category. And let's assume your first independent variable is sex (males vs females).

Let's say the output for D1 -> males is exp(B)= 1.21, this means for males the odds increase by a factor 1.21 for being in the category D1 rather than D3 (reference category) compared to females (reference category).

So you are always comparing against your reference category of the dependent but also independent variables. This is not true if you have a covariate variable. In that case it would mean; a one unit increase in X increases the odds by a factor of 1.21 of being in category D1 rather than D3.

For those with an ordinal dependent variable:

If you have an ordinal dependent variable and did not do an ordinal regression because of the assumption of proportional odds for instance. Keep in mind your highest category is the reference category. Your result as above are valid to report. But keep in mind that an increase in odds than in fact means an increase in odds of being in the lower category rather than the higher! But that's only if you have an ordinal dependant variable.

If you want to know the increase in percentage, well take a fictive odds-number, let's say 100 and multiply it by 1.21 which is 121? Compared to 100 how much did it change percentage wise?


0

Say that exp(b) in an mlogit is 1.04. if you multiply a number by 1.04, then it increases by 4%. That is the relative risk of being in category a instead of b. I suspect that part of the confusion here might have to do with by 4% (multiplicative meaning) and by 4 percent points (additive meaning). The % interpretation is correct if we talk about a percentage change not percentage point change. (The latter would not make sense anyhow as relative risks aren't expressed in terms of percentages.)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.