Atualmente, estou executando alguns modelos lineares de efeito misto.
Estou usando o pacote "lme4" em R.
Meus modelos assumem a forma:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
Antes de executar meus modelos, verifiquei a possibilidade de multicolinearidade entre preditores.
Eu fiz isso por:
Faça um quadro de dados dos preditores
dummy_df <- data.frame(predictor1, predictor2)
Use a função "cor" para calcular a correlação de Pearson entre preditores.
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
Se "correl_dummy_df" fosse maior que 0,80, decidi que o preditor1 e o preditor2 estavam muito correlacionados demais e não foram incluídos nos meus modelos.
Ao fazer algumas leituras, apareceriam maneiras mais objetivas de verificar a multicolinearidade.
Alguém tem algum conselho sobre isso?
O "fator de inflação de variação (VIF)" parece ser um método válido.
O VIF pode ser calculado usando a função "corvif" na embalagem do DEA (não cran). O pacote pode ser encontrado em http://www.highstat.com/book2.htm . O pacote suporta o seguinte livro:
Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA e Smith, GM 2009. Modelos de efeitos mistos e extensões em ecologia com R, 1ª edição. Springer, Nova Iorque.
Parece que uma regra geral é que, se VIF for> 5, a multicolinearidade será alta entre os preditores.
O uso do VIF é mais robusto que a simples correlação de Pearson?
Atualizar
Encontrei um blog interessante em:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/
O blogueiro fornece um código útil para calcular o VIF para modelos do pacote lme4.
Eu testei o código e funciona muito bem. Na minha análise subsequente, descobri que a multicolinearidade não era um problema para meus modelos (todos os valores de VIF <3). Isso foi interessante, já que eu havia encontrado alta correlação de Pearson entre alguns preditores.
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
embalagem foi descontinuada ; em vez disso, apenassource("http://www.highstat.com/Book2/HighstatLibV6.R")
para acorvif
função. (2) Espero fornecer uma resposta real, mas (a) acredito que o VIF leva em consideração a multicolinearidade (por exemplo, você pode ter três preditores, nenhum dos quais tem fortes correlações pareadas, mas a combinação linear de A e B está fortemente correlacionada com C ) e (b) tenho fortes reservas quanto à sabedoria de abandonar termos colineares; veja Graham Ecology 2003, doi: 10.1890 / 02-3114