Diferença entre modelos lineares generalizados e modelos mistos lineares generalizados


34

Eu estou querendo saber quais são as diferenças entre GLMs mistos e não misturados. Por exemplo, no SPSS, o menu suspenso permite que os usuários se ajustem:

  • analyze-> generalized linear models-> generalized linear models &
  • analyze-> mixed models-> generalized linear

Eles lidam com valores ausentes de maneira diferente?

Minha variável dependente é binária e tenho várias variáveis ​​independentes categóricas e contínuas.


Respostas:


62

O advento de modelos lineares generalizados nos permitiu criar modelos de dados do tipo regressão quando a distribuição da variável de resposta não é normal - por exemplo, quando o seu DV é binário. (Se você gostaria de saber um pouco mais sobre GLiMs, escrevi uma resposta bastante extensa aqui , que pode ser útil, embora o contexto seja diferente.) No entanto, um GLiM, por exemplo, um modelo de regressão logística, assume que seus dados são independentes . Por exemplo, imagine um estudo que analise se uma criança desenvolveu asma. Cada criança contribui com umOs dados apontam para o estudo - eles têm asma ou não. Às vezes, os dados não são independentes. Considere outro estudo que analisa se uma criança está resfriada em vários momentos do ano letivo. Nesse caso, cada criança contribui com muitos pontos de dados. Ao mesmo tempo, uma criança pode ter um resfriado, mais tarde não, e ainda mais tarde pode ter outro resfriado. Esses dados não são independentes porque vieram do mesmo filho. Para analisar adequadamente esses dados, precisamos levar em consideração essa não independência. Há duas maneiras: Uma maneira é usar as equações de estimativa generalizada (que você não mencionou, então vamos pular). A outra maneira é usar um modelo misto linear generalizado. Os GLiMMs podem explicar a não independência adicionando efeitos aleatórios (como observa @MichaelChernick). Portanto, a resposta é que sua segunda opção é para dados repetidos fora do normal (ou não independentes). (Devo mencionar, de acordo com o comentário de @ Macro, que modelos mistos lineares generalizados incluem modelos lineares como um caso especial e, portanto, podem ser usados ​​com dados normalmente distribuídos. No entanto, no uso típico, o termo conota dados não normais.)

Atualização: (O OP também perguntou sobre o GEE, então escreverei um pouco sobre como os três se relacionam.)

Aqui está uma visão geral básica:

  • um GLiM típico (usarei regressão logística como o caso prototípico) permite modelar uma resposta binária independente em função de covariáveis
  • um GLMM permite modelar uma resposta binária não independente (ou em cluster) condicional aos atributos de cada cluster individual como uma função de covariáveis
  • o GEE permite modelar a resposta média da população de dados binários não independentes em função de covariáveis

Como você tem várias tentativas por participante, seus dados não são independentes; como você observou corretamente, "[os] materiais dentro de um participante provavelmente serão mais semelhantes do que em comparação com todo o grupo". Portanto, você deve usar um GLMM ou o GEE.

A questão, então, é como escolher se o GLMM ou o GEE seria mais apropriado para sua situação. A resposta a esta pergunta depende do assunto da sua pesquisa - especificamente, o objetivo das inferências que você espera fazer. Como afirmei acima, com um GLMM, os betas estão falando sobre o efeito de uma alteração de uma unidade em suas covariáveis ​​em um determinado participante, dadas as características individuais deles. Por outro lado, com o GEE, os betas estão falando sobre o efeito de uma alteração de uma unidade em suas covariáveis ​​na média das respostas de toda a população em questão. Essa é uma distinção difícil de entender, especialmente porque não existe essa distinção com modelos lineares (nesse caso, os dois são a mesma coisa).

Uma maneira de tentar entender isso é imaginar uma média da população em ambos os lados do sinal de igual em seu modelo. Por exemplo, este pode ser um modelo: que: Há um parâmetro que governa a distribuição da resposta ( , a probabilidade, com dados binários) no lado esquerdo de cada participante. No lado direito, existem coeficientes para o efeito da covariável e do nível de linha de base quando a covariável é igual a 0. A primeira coisa a notar é que a interceptação real para qualquer indivíduo específico não é , mas sim

logit(pEu)=β0 0+β1 1X1 1+bEu
pβ0(β0+bi)biβ0β1pilogitβ1
logit(p)=em(p1 1-p),     &      bN(0 0,σb2)
p β0 0(β0 0+bEu) . Mas e daí? Se estamos assumindo que os 's (o efeito aleatório) são normalmente distribuídos com uma média de 0 (como fizemos), certamente podemos média sem dificuldade (seria apenas ). Além disso, neste caso, não temos um efeito aleatório correspondente para as pistas e, portanto, a média delas é apenas . Portanto, a média das interceptações mais a média das pistas deve ser igual à transformação logit da média dos 's à esquerda, não deve? Infelizmente não . O problema é que entre esses dois está o , que é um não linear.bEuβ0 0β1 1pEulogittransformação. (Se a transformação fosse linear, eles seriam equivalentes, e é por isso que esse problema não ocorre em modelos lineares.) O gráfico a seguir esclarece: insira a descrição da imagem aqui
Imagine que esse gráfico represente o processo de geração de dados subjacente para a probabilidade de uma classe pequena dos alunos será capaz de passar em um teste em algum assunto com um determinado número de horas de instrução sobre esse tópico. Cada uma das curvas cinza representa a probabilidade de passar no teste com quantidades variáveis ​​de instrução para um dos alunos. A curva em negrito é a média de toda a classe. Nesse caso, o efeito de uma hora adicional de ensino condicional nos atributos do aluno éβ1 1- o mesmo para cada aluno (ou seja, não há uma inclinação aleatória). Observe, porém, que a capacidade da linha de base dos alunos difere entre eles - provavelmente devido a diferenças em coisas como QI (ou seja, existe uma interceptação aleatória). A probabilidade média da turma como um todo, no entanto, segue um perfil diferente dos alunos. O resultado surpreendentemente contra-intuitivo é o seguinte: uma hora adicional de instrução pode ter um efeito considerável na probabilidade de cada aluno passar no teste, mas tem relativamente pouco efeito na provável proporção total de alunos que passam . Isso ocorre porque alguns alunos já podem ter uma grande chance de passar, enquanto outros ainda podem ter pouca chance.

A questão de se você deve usar um GLMM ou o GEE é a questão de qual dessas funções você deseja estimar. Se você quiser saber sobre a probabilidade de aprovação de um determinado aluno (se, por exemplo, você era o aluno ou os pais dele), você deseja usar um GLMM. Por outro lado, se você deseja saber sobre o efeito na população (se, por exemplo, você era o professor ou o diretor), você gostaria de usar o GEE.

Para outra discussão mais detalhada matematicamente deste material, consulte esta resposta do @Macro.


2
Esta é uma boa resposta, mas acho que, especialmente a última frase, parece quase indicar que você usa apenas GLMs ou GLMMs para dados não normais que provavelmente não foram planejados, uma vez que os modelos lineares (mistos) gaussianos comuns também se enquadram a categoria GL (M) M.
Macro

@ Macro, você está certo, eu sempre esqueço isso. Eu editei a resposta para esclarecer isso. Deixe-me saber se você acha que precisa de mais.
gung - Restabelece Monica

Também verifiquei equações de estimativa generalizadas. É correto que, como no GLiM, o GEE suponha que meus dados sejam independentes? Eu tenho vários testes por participante. Os ensaios em um participante provavelmente serão mais semelhantes do que em comparação com todo o grupo.
user9203

@gung, Embora o GEE possa produzir coeficientes " médios da população", se eu quisesse estimar o Efeito Médio do Tratamento (ATE) na escala de probabilidade na população real, para um regressor binário de interesse, não precisaria fazer um abordagem por assunto? A maneira de calcular o ATE, que eu saiba, é estimar a probabilidade prevista para cada pessoa com e sem tratamento e depois calcular a média dessas diferenças. Isso não requer um método de regressão que possa gerar probabilidades previstas para cada pessoa (apesar do fato de serem calculadas sobre a média)?
Yakkanomica 30/01

11
@ Yakkanomica, se é isso que você quer, com certeza.
gung - Restabelece Monica

6

A chave é a introdução de efeitos aleatórios. O link de Gung menciona isso. Mas acho que deveria ter sido mencionado diretamente. Essa é a principal diferença.


+1, você está certo. Eu deveria ter sido mais claro sobre isso. Eu editei minha resposta para incluir este ponto.
gung - Restabelece Monica

Sempre que adiciono um efeito aleatório, como uma interceptação aleatória ao modelo, recebo uma mensagem de erro. Eu acho que não tenho pontos de dados suficientes para adicionar efeitos aleatórios. Pode ser este o caso? mensagem de erro: glmm: A matriz Hessiana final não é definitiva positiva, embora todos os critérios de convergência sejam atendidos. O procedimento continua apesar deste aviso. Os resultados subsequentes produzidos são baseados na última iteração. A validade do ajuste do modelo é incerta.
user9203

3

Sugiro que você também examine as respostas de uma pergunta que fiz há algum tempo:

Modelo linear geral vs. modelo linear generalizado (com uma função de vínculo de identidade?)


5
Eu não acho que realmente responda à pergunta, que é sobre os recursos do SPSS para executar o GLM e os modelos de efeito misto, e como ele lida com os valores ausentes. Isso deveria ser um comentário? Caso contrário, esclareça.
chl

Desculpe, o post de abertura parecia ter duas "perguntas". 1. Gostaria de saber o que .... e 2. Eles lidam com os valores ausentes de maneira diferente? Eu estava tentando ajudar com a primeira pergunta.
Behacad 17/07/2012

11
Justo. Sem maiores explicações, ainda acho que isso se encaixaria melhor como um comentário ao OP.
chl
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.