Suponhamos que tem alguns alguma variável resposta que foi medido a partir de th irmão em th família. Além disso, alguns dados comportamentais foram coletados ao mesmo tempo de cada sujeito. Estou tentando analisar a situação com o seguinte modelo linear de efeitos mistos:
onde e são a interceptação e a inclinação fixas, respectivamente, é a inclinação aleatória e é o resíduo.
As suposições para os efeitos aleatórios e residual são (supondo que haja apenas dois irmãos em cada família)
onde é um parâmetro de variância desconhecido e a estrutura de variância-covariância R é uma matriz simétrica 2 x 2 da forma
que modela a correlação entre os dois irmãos.
Esse é um modelo apropriado para esse estudo de irmãos?
Os dados são um pouco complicados. Entre as 50 famílias, quase 90% delas são gêmeos dizigóticos (DZ). Para as demais famílias,
- dois têm apenas um irmão;
- dois têm um par DZ mais um irmão; e
- dois têm um par DZ mais dois irmãos adicionais.
Acredito que
lme
o pacote Rnlme
possa lidar facilmente com (1) com situações ausentes ou desequilibradas. Meu problema é: como lidar com (2) e (3)? Uma possibilidade em que posso pensar é dividir cada uma dessas quatro famílias em (2) e (3) em duas, para que cada subfamília tenha um ou dois irmãos, para que o modelo acima ainda possa ser aplicado. Isso é bom? Outra opção seria simplesmente jogar fora os dados dos um ou dois irmãos extras em (2) e (3), o que parece ser um desperdício. Alguma abordagem melhor?Parece que
lme
permite fixar os valores de na matriz de variância-covariância residual , por exemplo = 0,5. Faz sentido impor a estrutura de correlação ou devo simplesmente estimar com base nos dados?
lme