Use GEE quando estiver interessado em descobrir o efeito médio da população de uma covariável versus o efeito específico individual. Essas duas coisas são equivalentes apenas em modelos lineares, mas não em não lineares (por exemplo, logística). Para ver isso, considere, por exemplo, o modelo logístico de efeitos aleatórios da ésima observação do ésimo sujeito, ;jiYij
log(pij1−pij)=μ+ηi
onde é um efeito aleatório para sujeitos e .ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
Se você usasse um modelo de efeitos aleatórios nesses dados, obteria uma estimativa de que explica o fato de que uma perturbação média zero normalmente distribuída foi aplicada a cada indivíduo, tornando-o específico.μ
Se você usasse o GEE nesses dados, estimaria as probabilidades médias de log da população. Nesse caso, isso seria
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , em geral. Por exemplo, se e , então . Embora os efeitos aleatórios tenham média zero na escala transformada (ou vinculada ), seu efeito não é média zero na escala original dos dados. Tente simular alguns dados de um modelo de regressão logística de efeitos mistos e comparar a média do nível da população com o logit inverso da interceptação e você verá que eles não são iguais, como neste exemplo. Essa diferença na interpretação dos coeficientes é a diferença fundamental entre os modelos de efeitos aleatórios e GEE .μ=1σ2=1ν≈.83
Edit: Em geral, um modelo de efeitos mistos sem preditores pode ser escrito como
ψ(E(Yij|ηi))=μ+ηi
onde é uma função de link. Sempre queψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
haverá uma diferença entre os coeficientes médios da população (GEE) e os coeficientes específicos individuais (modelos de efeitos aleatórios). Ou seja, as médias mudam transformando os dados, integrando os efeitos aleatórios na escala transformada e depois transformando de volta. Observe que no modelo linear (ou seja, ), a igualdade se mantém, portanto são equivalentes.ψ(x)=x
Edit 2: Também é importante notar que os erros padrão "robustos" do tipo sanduíche produzidos por um modelo GEE fornecem intervalos de confiança assintóticos válidos (por exemplo, eles realmente cobrem 95% do tempo), mesmo que a estrutura de correlação especificada no modelo não seja corrigir.
Edit 3: Se seu interesse é entender a estrutura de associação nos dados, as estimativas de associações de GEE são notoriamente ineficientes (e às vezes inconsistentes). Vi uma referência para isso, mas não posso colocá-la agora.