Vou me concentrar principalmente em suas três primeiras perguntas. As respostas curtas são: (1) você precisa comparar o efeito do IV no DV para cada período de tempo, mas (2) apenas comparar as magnitudes pode levar a conclusões erradas e (3) existem várias maneiras de fazer isso, mas não há consenso sobre qual deles está correto.
Abaixo, descrevo por que você não pode simplesmente comparar magnitudes de coeficientes e apontar algumas soluções que foram pensadas até agora.
Segundo Allison (1999), diferentemente do OLS, os coeficientes de regressão logística são afetados pela heterogeneidade não observada, mesmo quando essa heterogeneidade não está relacionada à variável de interesse.
Quando você ajusta uma regressão logística como:
ln(11−pi)=β0+β1x1i
y∗1y∗
y∗=α0+α1x1i+σε
ε
αβ
βj=αjσj=1,...,J.
σβσ
Isso ocorre porque as comparações podem produzir conclusões incorretas se a variação não observada diferir entre grupos, países ou períodos. Ambas as comparações usando modelos diferentes e usando termos de interação no mesmo modelo sofrem com esse problema. Além do logit, isso também se aplica a seus primos probit, clog-log, cauchit e, por extensão, a modelos discretos de risco de tempo estimados usando essas funções de link. Os modelos de logit ordenados também são afetados por ele.
Williams (2009) argumenta que a solução é modelar a variação não observada por meio de um modelo de escolha heterogêneo (também conhecido como modelo de escala de localização) e fornece um complemento Stata chamado oglm
para isso (Williams 2010). Em R, modelos de escolha heterogêneos podem ser ajustados com a hetglm()
função do glmx
pacote, disponível através do CRAN. Ambos os programas são muito fáceis de usar. Por fim, Williams (2009) menciona a PLUM
rotina do SPSS para ajustar esses modelos, mas nunca a usei e não posso comentar como é fácil usá-la.
No entanto, há pelo menos um documento de trabalho por aí mostrando que comparações usando modelos de escolha heterogênea podem ser ainda mais tendenciosas se a equação de variância for mal especificada ou se houver erro de medição.
Mood (2010) lista outras soluções que não envolvem modelagem da variância, mas usam comparações de mudanças de probabilidade previstas.
Aparentemente, é uma questão que não está resolvida, e muitas vezes vejo trabalhos em conferências da minha área (Sociologia) apresentando soluções diferentes para isso. Aconselho você a olhar para o que as pessoas em seu campo fazem e depois decidir como lidar com isso.
Referências
- Allison, PD (1999). Comparando coeficientes Logit e Probit entre grupos. Sociological Methods & Research, 28 (2), 186–208.
- Mood, C. (2010). Regressão logística: por que não podemos fazer o que achamos que podemos fazer e o que podemos fazer sobre isso. European Sociological Review, 26 (1), 67-82.
- Williams, R. (2009). Usando modelos de escolha heterogênea para comparar coeficientes de logit e probit entre grupos. Sociological Methods & Research, 37 (4), 531–559.
- Williams, R. (2010). Ajustando modelos de escolha heterogêneos com oglm. The Stata Journal, 10 (4), 540-567.