Qual é a diferença entre (1|DNA.concentration/mouse.id)e (DNA.concentration|mouse.id)? O que significam os símbolos |e /significam dentro da sintaxe para o efeito aleatório?
(1|a/b), mas não para a distinção entre (1|a/b)e (b|a)...
Qual é a diferença entre (1|DNA.concentration/mouse.id)e (DNA.concentration|mouse.id)? O que significam os símbolos |e /significam dentro da sintaxe para o efeito aleatório?
(1|a/b), mas não para a distinção entre (1|a/b)e (b|a)...
Respostas:
Se você possui dois fatores categóricosf e g, em seguida, (1|f/g)expande para (1|f) + (1|f:g), isto é, variação na interceptação (que fica 1no lado esquerdo da barra) entre os níveis de fe entre os níveis de f:g(a interação entre fe g). Isso também é chamado de efeito aleatório de g aninhado dentro f (a ordem é importante aqui). Essa é a maneira tradicional de combinar dois fatores aleatórios em um modelo clássico de ANOVA, porque nessa estrutura os efeitos aleatórios devem ser aninhados (ou seja, festá aninhado dentro gou ganinhado f). (Consulte http://glmm.wikidot.com/faqpara obter mais informações sobre fatores aninhados.) Este modelo estima dois parâmetros, por exemplo, e , não importa quantos níveis cada variável categórica tenha. Seria um modelo típico para um design aninhado . σ 2 f : g
Por outro lado, (f|g)especifica que os efeitos de fvariam entre os níveis de g: por exemplo, se fé uma variável categórica de dois níveis com os níveis "controle" e "tratamento", esse modelo especifica que estamos permitindo a interceptação (resposta de controle) e o efeito do tratamento (diferença entre as respostas de controle e tratamento) varia entre os níveis de g. Cada efeito tem sua própria variação e, por padrão, lme4combina covariâncias entre cada um dos parâmetros. Este modelo estimaria os parâmetros , e , onde o último se refere à covariância entre os efeitos de controle e tratamento. Se tiver σ 2 g , t σ g , c ⋅ t f n n ( n + 1 ) / 2 níveis, este modelo estima parâmetros; é mais apropriado para um delineamento em blocos ao acaso, onde cada tratamento é repetido em cada bloco.
Se ftiver muitos níveis, a última (f|g)) especificação de modelo pode implicar modelos com muitos parâmetros; Há um debate em andamento (veja, por exemplo, este artigo do ArXiv ) sobre a melhor maneira de lidar com essa situação.
Se, em vez disso, considerarmos (x|g)onde xé uma variável de entrada contínua (numérica), o termo especifica um modelo de pistas aleatórias; a interceptação (implicitamente) e a inclinação em relação a xambos variam entre os níveis de g(um termo de covariância também é adequado).
Nesse caso, (g|x)não faria sentido - o termo no lado direito da barra é uma variável de agrupamento e sempre é interpretado como categórico. O único caso em que isso poderia fazer sentido é em um design xcontínuo, mas várias observações foram feitas em cada nível e em que você deseja tratar xcomo uma variável categórica para fins de modelagem.