Interpretação de coeficientes para regressão de Poisson


8

Não entendo como interpretar o coeficiente de uma regressão de Poisson em relação ao coeficiente de uma regressão de OLS.

Suponha que eu tenha dados de séries temporais, minha variável do lado esquerdo é o número de jogos ganhos por ano e minha variável principal do lado direito é o valor do NASDAQ. Se minha especificação preferida é interpretar o modelo em termos percentuais, tomo a transformação de log dos jogos ganhos. Também posso pegar o log da NASDAQ para dizer quanto um aumento de 1% no NASDAQ aumentaria a porcentagem de jogos ganhos. Agora, reconheço que um modelo de Poisson pode fazer sentido porque os dados dos jogos vencidos são importantes e não contínuos. Eu corro a regressão com digamos muitas, muitas variáveis ​​de controle.

Eu não faria uma transformação de log nos jogos vencidos e usaria apenas jogos? Quando obtenho os coeficientes, faço algum tipo de cálculo de efeitos marginais (como pode ser feito para probit)?
Como interpreto esses coeficientes?
Como comparo a interpretação do Poisson ao OLS - o OLS que é transformado em log ou o OLS que não é?

Sei que esse tipo de pergunta já foi feito antes, mas ainda não o entendi.


Respostas:


10

Para não ser crítico, mas esse é um exemplo estranho. Não está claro que você esteja realmente analisando séries temporais, nem o que o NASDAQ teria a ver com o número de jogos vencidos por alguma equipe. Se você estiver interessado em dizer algo sobre o número de jogos que um time venceu, acho que seria melhor usar a regressão logística binária, já que você provavelmente sabe quantos jogos são disputados. A regressão de Poisson é mais apropriada para falar sobre contagens quando o total possível não é bem restrito ou pelo menos desconhecido.

Como você interpretaria seus betas depende, em parte, do link usado - é possível usar o link de identidade, mesmo que o link de log seja mais comum (e geralmente mais apropriado). Se você estiver usando o link de log, provavelmente não pegaria o log de sua variável de resposta - o link em essência está fazendo isso por você. Vamos considerar um caso abstrato: você tem um modelo de Poisson usando o link de log da seguinte maneira: alternativa,

y^=exp(β^0)exp(β^1)x
y^=exp(β^0+β^1x)

(EDIT: Estou removendo os "chapéus" dos betas a seguir, porque são feios, mas ainda devem ser entendidos.)

Com a regressão OLS normal, você está prevendo a média de uma distribuição gaussiana da variável de resposta condicional aos valores das covariáveis. Nesse caso, você está prevendo a média de uma distribuição de Poisson da variável de resposta condicional aos valores das covariáveis. Para o OLS, se um determinado caso for 1 unidade mais alto em sua covariável, você espera que todas as coisas sejam iguais, a média dessa distribuição condicional seja unidades mais alta. Aqui, se um dado caso for 1 unidade mais alto, ceteris paribus , você espera que a média condicional seja vezes maior. Por exemplo, digaβ1eβ1 β1=2, então, na regressão normal, é 2 unidades a mais (ou seja, +2) e aqui é 7,4 vezes maior (ou seja, x 7,4). Nos dois casos, é sua interceptação ; em nossa equação acima, considere a situação em que , exp , e o lado direito reduz-se a exp ( ), que fornece a média de quando todas as covariáveis ​​são iguais a 0. β0x=0(β1)x=1β0y

Há algumas coisas que podem ser confusas sobre isso. Primeiro, prever a média de uma distribuição de Poisson não é o mesmo que prever a média de uma gaussiana. Com uma distribuição normal, a média é o valor mais provável. Porém, com o Poisson, a média geralmente é um valor impossível (por exemplo, se sua média prevista for 2,7, não é possível contar). Além disso, normalmente a média não está relacionada ao nível de dispersão (isto é, o DP), mas com a distribuição de Poisson, a variação necessariamente é igual à média (embora, na prática, geralmente não o faça, levando a complexidades adicionais). Finalmente, essas exponenciações tornam mais complicadas; se, em vez de uma mudança relativa, você quisesse saber o valor exato, teria que começar em 0 (ou seja,eβ0) e multiplique seu caminho vezes. Para prever um valor específico, é mais fácil resolver a expressão entre parênteses na equação inferior e depois exponenciar; isso torna o significado da versão beta menos claro, mas a matemática é mais fácil e reduz a possibilidade de erro. x


Obrigado pela ajuda! Sim, eu concordo que o exemplo é terrível. Obrigado pela abstração. Eu entendo como interpretar o OLS. Um aumento de 1 unidade em x leva a um aumento beta_1 em y. Se eu fizer uma transformação de log em y, um aumento de 1 unidade em x levará a um aumento de 100 * beta_1% em y. Não entendo o que fazer com Poisson. Se eu conheço beta_1, um aumento de 1 unidade em x leva a um aumento em y?
user1690130

Está na resposta, no terceiro parágrafo. Um aumento de 1 unidade em x leva a um aumento de exp ( ) vezes em y. Digamos que seu 'velho' y era 10 e , exp ( ) = 7,4 e y seria 10 vezes 7,4, ou seja, 74. Se houvesse outra observação que fosse 1 unidade mais alta, isso seria 74 * 7.4, etc.β1β1=2β1
gung - Restabelece Monica

Não estou entendendo porque parece depender dos valores de x e y? Existe um "efeito marginal" pelo qual as pessoas tendem a passar? Por exemplo, as pessoas não usam mfx no Stata para relatar estimativas de probit?
user1690130

1
Eu não sigo isso. Você não compara OLS a Poisson; são tipos diferentes de modelos para diferentes tipos de situações / fenômenos. Eles não são dois modelos diferentes da mesma coisa em que um modelo pode ser uma conta melhor do que o outro. Você não compararia um gatinho e uma árvore de Natal para ver se eu era melhor. Não entendi bem como você está usando a frase "efeito marginal", se você quer dizer o efeito de um preditor que ignora os efeitos de todas as outras variáveis (como o efeito marginal de um fator na ANOVA) e exp ( ) é o efeito multiplicativo marginal de . β1x1
gung - Restabelece Monica

1
Eu, como @gung, não tenho certeza do que você está tentando fazer. Mas se você quiser comparar os resultados dos dois modelos, poderá plotar os valores previstos de cada um em um gráfico de dispersão. Comparar os coeficientes não faz sentido.
Peter Flom
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.