Interpretando a variação aleatória de efeitos no glmer


12

Estou revisando um artigo sobre polinização, onde os dados são distribuídos binomialmente (os frutos amadurecem ou não). Então eu usei glmercom um efeito aleatório (planta individual) e um efeito fixo (tratamento). Um revisor deseja saber se a planta teve um efeito no conjunto das frutas - mas estou tendo problemas para interpretar oglmer resultados.

Eu li na web e parece que pode haver problemas com comparação direta glme glmermodelos, por isso não estou fazendo isso. Imaginei que a maneira mais direta de responder à pergunta seria comparar a variação do efeito aleatório (1,444 abaixo) com a variação total ou a variação explicada pelo tratamento. Mas como eu calculo essas outras variações? Eles não parecem estar incluídos na saída abaixo. Li algo sobre as variações residuais não incluídas no binômio glmer- como interpreto a importância relativa do efeito aleatório?

> summary(exclusionM_stem)
Generalized linear mixed model fit by maximum likelihood (Laplace
  Approximation) [glmerMod]
 Family: binomial  ( logit )
Formula: cbind(Fruit_1, Fruit_0) ~ Treatment + (1 | PlantID)

     AIC      BIC   logLik deviance df.resid 
   125.9    131.5    -59.0    117.9       26 

Scaled residuals: 
    Min      1Q  Median      3Q     Max 
-2.0793 -0.8021 -0.0603  0.6544  1.9216 

Random effects:
 Groups  Name        Variance Std.Dev.
 PlantID (Intercept) 1.449    1.204   
Number of obs: 30, groups:  PlantID, 10

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -0.5480     0.4623  -1.185   0.2359   
TreatmentD   -1.1838     0.3811  -3.106   0.0019 **
TreatmentN   -0.3555     0.3313  -1.073   0.2832   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
           (Intr) TrtmnD
TreatmentD -0.338       
TreatmentN -0.399  0.509

Respostas:


11

Embora, em princípio, seja possível obter um análogo de "variação de proporção explicada por cada efeito" para GLMMs, existem vários fatores complicadores (quais níveis do modelo você considera "variação total" e como você quantifica a variação de amostragem devido à distribuição de amostragem de nível mais baixo [Binomial neste caso])? Nakagawa e Schielzeth (doi: 10.1111 / j.2041-210x.2012.00261.x) apresentam uma abordagem geral para calcular R ^ 2 (proporção da variação total explicada) para (G) LMMs que se tornou bastante popular em ecologia; Xu e cols. 2003adote uma abordagem semelhante. Em princípio, essa abordagem provavelmente poderia ser estendida para considerar a proporção da variação explicada por termos diferentes [mas observe que a 'proporção da variação' de todos os termos do modelo considerado dessa maneira provavelmente não chegaria a 100% - poderia seja mais ou menos].

4σ-1,96σ+1,96σ

Visualmente:

insira a descrição da imagem aqui


R2

1
Eu estava apenas dizendo que não acho que seja uma pergunta louca ou necessariamente mal colocada. Mas a estrutura hierárquica e os modelos semelhantes ao GLM abrem latas de vermes que dificultam a resposta. Geralmente não me incomodo, mas posso ver por que as pessoas tentariam encontrar números que medissem a qualidade do ajuste ou a importância relativa dos termos em um modelo, de maneira razoável.
Ben Bolker 23/05

Que é razoável. Btw, o que você acha da minha sugestão de que, com 10 plantas, 3 tratamentos e N = 30, o OP poderia se encaixar em um modelo usando ambos como efeitos fixos? Não acho necessariamente que esse seria o modelo final certo, é claro, mas parece-me uma maneira potencialmente permitida de testar se há variação entre as plantas e de colocar as duas variáveis ​​em pé de igualdade para comparação.
gung - Restabelece Monica

me parece razoável.
Ben Bolker

Eu ajustei um modelo com o tratamento e a planta como efeitos fixos, conforme sugerido pelo gung, e o termo da planta tinha um valor p muito alto (p = 0,3). Isso parece estranho, dado que, como você diz, "o desvio padrão estimado entre plantas é de 1,20, muito próximo da magnitude do maior efeito de tratamento (-1,18)"? Por que apareceria como insignificante em uma ANOVA com 2 efeitos fixos?
Jwb4

3

PlantID0 0

No seu caso, você tem várias medidas por planta, portanto, uma abordagem rápida e suja é executar um modelo com PlantIDum efeito fixo e testá-lo.


1

A resposta simples para o seu revisor é "Sim". Se ele está pedindo para você testar se a variação do efeito aleatório é significativamente diferente de 0, você tem algumas opções. Observe, porém, que muitas pessoas inteligentes se sentem desconfortáveis ​​ao testar se as variações de efeitos aleatórios são diferentes de 0.

O mais simples é um teste de razão de verossimilhança, embora não seja recomendado pela maioria. Eles são muito conservadores ao testar nos limites (ou seja, você está testando contra uma variação de 0, o mais baixo possível). Existe uma regra prática lá fora, que o valor de p é aproximadamente o dobro do que realmente é.

O método recomendado na maioria dos lugares é uma inicialização paramétrica. Você pode usar bootMerolme4 pacote. Certifique-se de definir o parâmetro REML da sua função lmer como FALSE; caso contrário, sua variação será maior que 0 100% do tempo (ou próximo a ele ... na verdade, provavelmente será maior que 0, quase 100% da Tempo de qualquer maneira).

Algumas dicas e outros recursos:

http://glmm.wikidot.com/faq (encontre o cabeçalho Como posso testar se um efeito aleatório é significativo?)

Teste paramétrico de inicialização do lmer () para efeitos fixos

http://www.r-bloggers.com/using-bootmer-to-do-model-comparison-in-r/


Obrigado por este guia lúcido (e rápido!) Para comparação de modelos. Mas como eu interpretaria a "magnitude" do efeito da variável aleatória? ou seja, como eu compararia a variação explicada pela minha variável aleatória com a variação explicada pela variável fixa (tratamento)? Acho que não vejo como isso é coletado nos resultados do teste LRT inicializado.
Jwb4

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.