REML ou ML para comparar dois modelos de efeitos mistos com diferentes efeitos fixos, mas com o mesmo efeito aleatório?

Histórico: Nota: Meu conjunto de dados e código-r estão incluídos abaixo do texto

Desejo usar o AIC para comparar dois modelos de efeitos mistos gerados usando o pacote lme4 em R. Cada modelo tem um efeito fixo e um efeito aleatório. O efeito fixo difere entre os modelos, mas o efeito aleatório permanece o mesmo entre os modelos. Descobri que se eu usar REML = T, o modelo2 tem a pontuação mais baixa na AIC, mas se eu usar REML = F, o modelo1 tem a pontuação mais baixa na AIC.

Suporte para o uso de ML:

Zuur et al. (2009; PÁGINA 122) sugerem que "Para comparar modelos com efeitos fixos aninhados (mas com a mesma estrutura aleatória), a estimativa de ML deve ser usada e não a REML". Isso indica para mim que devo usar o ML, pois meus efeitos aleatórios são os mesmos nos dois modelos, mas meus efeitos fixos diferem. [Zuur et al. 2009. Modelos de efeitos mistos e extensões em ecologia com R. Springer.]

Suporte para usar REML:

No entanto, percebo que, quando uso ML, a variação residual associada aos efeitos aleatórios difere entre os dois modelos (modelo1 = 136,3; modelo2 = 112,9), mas quando uso REML, é a mesma entre os modelos (modelo1 = modelo2 = 151,5). Isso implica para mim que eu deveria usar REML para que a variação residual aleatória permaneça a mesma entre modelos com a mesma variável aleatória.

Questão:

Não faz mais sentido usar REML do que ML para comparações de modelos em que os efeitos fixos mudam e os efeitos aleatórios permanecem os mesmos? Caso contrário, você pode explicar por que ou me apontar para outra literatura que explica mais?

# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)

# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)

Conjunto de dados:

Response    Fixed1  Fixed2  Random1
5.20    A   A   1
32.50   A   A   1
6.57    A   A   2
24.77   A   B   3
41.69   A   B   3
34.29   A   B   4
1.80    A   B   4
10.00   A   B   5
15.56   A   B   5
4.44    A   C   6
21.65   A   C   6
9.20    A   C   7
4.11    A   C   7
12.52   B   D   8
0.25    B   D   8
27.34   B   D   9
11.54   B   E   10
0.86    B   E   10
0.68    B   E   11
4.00    B   E   11

— Faz sentido
fonte

Faraway (2006) Estendendo o modelo linear com R (p. 156): "O motivo é que o REML estima os efeitos aleatórios considerando combinações lineares dos dados que removem os efeitos fixos. Se esses efeitos fixos forem alterados, as probabilidades do dois modelos não serão diretamente comparáveis ".

— Jvh_ch 25/09

Embora o AIC seja baseado na probabilidade, tanto quanto seja do meu conhecimento, ele foi desenvolvido para fins de previsão. Como alguém aplicaria exatamente um modelo misto para previsão?

— AdamO 25/09

@AdamO, você poderia ser mais preciso? Um modelo misto ajustado pode ser usado para previsão, seja no nível da população (prever respostas para uma unidade não especificada / desconhecida, definindo modos condicionais / BLUPs como zero) ou no nível individual (previsão da condição nas estimativas dos modos condicionais / BLUPs ) Se você puder ser mais específico, isso pode ser uma boa e nova pergunta sobre o currículo.

— Ben Bolker 25/09

Não estava claro para mim como você pretendia aplicar esse modelo. Nada no problema sugeria que tipo de previsão, se houver, estava sendo feita ou se era necessária e, em caso afirmativo, com que finalidade.

— AdamO 25/09

Respostas:

Zuur et al. E Faraway (do comentário de @ janhove acima) estão certos; o uso de métodos baseados em verossimilhança (incluindo AIC) para comparar dois modelos com diferentes efeitos fixos ajustados pelo REML geralmente levará a um absurdo.

— Ben Bolker
fonte

Obrigado @janhove, AdamO e Ben Bolker. Também achei este link de Aaron útil para responder a essa pergunta. Ele diz: "A probabilidade de REML depende de quais efeitos fixos estão no modelo e, portanto, não são comparáveis se os efeitos fixos forem alterados. REML é geralmente considerado como fornecendo melhores estimativas para os efeitos aleatórios; portanto, o conselho usual é ajustar-se seu melhor modelo usando REML para sua inferência e relatório final ".

— Figura

Vou dar um exemplo para ilustrar por que a probabilidade REML não pode ser usada para coisas como comparações da AIC. Imagine que temos um modelo normal de efeitos mistos. Deixe denotar a matriz de design e suponha que essa matriz tenha classificação completa. Podemos encontrar uma reparametrização do valor médio do espaço, dada pela matriz . As duas matrizes abrangem o mesmo subespaço linear de . Assim, as colunas de pode ser escrito como combinações lineares das colunas de . Portanto, podemos encontrar uma matriz quadrática, , tal que $X$ $\tilde{X}$ $\mathbb{R}^n$ $\tilde{X}$ $X$ $B$

$\tilde{X} = XB$ .

Além disso, tem classificação completa (isso pode ser comprovado assumindo que não; então também não seria uma contradição). Isso significa que é invertível. $B$ $X$ $B$

Se começarmos a usar a segunda parametrização do espaço de valor médio e deixar ser uma matriz de covariância, vamos considerar o critério REML que devemos maximizar (estou omitindo uma constante) $V$

$|V|^{-1/2}|\tilde{X}'V^{-1}\tilde{X}|^{-1/2}\exp((y-\tilde{X}\tilde{\beta})'V^{-1}(y-\tilde{X}\tilde{\beta})/2)$ ,

sobre o conjunto de parâmetros, em que . Usando o fato de que , podemos perceber que isso pode ser reescrito como $\beta = (\tilde{X}V^{-1}\tilde{X})^{-1}y$ $X = \tilde{X}B$

$|B||V|^{-1/2}||X'V^{-1}X|^{-1/2}|\exp((y-X\bar{\beta})'V^{-1}(y-X\bar{\beta})/2)$ ,

onde . Essa é a probabilidade de REML para os outros tempos de parametrização o determinante de. $\bar{\beta} = (XV^{-1}X)^{-1}y$ $|B|$

Portanto, temos um exemplo de duas parametrizações diferentes do mesmo modelo, fornecendo diferentes valores de probabilidade, assumindo que (essa matriz pode ser facilmente encontrada). O mesmo valor de parâmetro maximizará o critério nos dois casos, mas o valor da probabilidade será diferente. Isso mostra que existe um elemento arbitrário no valor da probabilidade e, portanto, ilustra por que não se pode usar o valor da probabilidade para comparação entre modelos com diferentes efeitos fixos: você seria capaz de alterar os resultados simplesmente alterando a parametrização do espaço de valor médio em um dos modelos. $|B| \neq 1$

Este é um exemplo de por que o REML não deve ser usado ao comparar modelos com diferentes efeitos fixos. REML, no entanto, muitas vezes estima melhor os parâmetros de efeitos aleatórios e, portanto, às vezes é recomendável usar ML para comparações e REML para estimar um modelo único (talvez final).

— swmo
fonte