Vasculhei muitos sites de ajuda e ainda estou confuso sobre como especificar termos aninhados mais complicados em um modelo misto também. Eu também estou confuso como o uso de :
e /
e |
em especificação de interações e de nidificação com fatores aleatórios utilizando lmer()
no lme4
pacote no R
.
Para o propósito desta pergunta, suponha que eu tenha retratado com precisão meus dados com este modelo estatístico padrão: são fixos e são aleatórios. está (implicitamente) aninhado dentro .
station
tow
day
Tow
station
Em outras palavras, espero que meu modelo inclua Station (i, fixo), Tow (j, aleatório, implicitamente aninhado dentro de Station), Dia (k, aleatório) e interação entre Tow e Day e a interação entre Day e estação. Consultei um estatístico para criar meu modelo e, no momento, acredito que seja representativo dos meus dados, mas também adicionarei uma descrição dos meus dados para aqueles que estão interessados na parte inferior da minha postagem para não desorganizar.
Até agora, o que consegui juntar é o seguinte lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Isso representa com precisão meu modelo estatístico? Alguma sugestão de como melhorar meu código se ele não for lido corretamente?
Coloquei em negrito os termos específicos que estou tendo dificuldade em especificar na minha fórmula mais recente
# 1 tow aninhado dentro da estação quando o reboque é aleatório e a estação é fixa
Estou confuso, no entanto, sobre a diferenciação entre termos aninhados e de interação que são aleatórios usando :
e /
. No meu exemplo acima, eu tenho (1|station:tow)
no qual espero ler aninhados dentro da estação. Eu li comentários conflitantes em vários sites, se devo ou não usar :
ou /
aqui no (1|...)
formato aleatório de lmer
.
# 2 A interação entre estação e dia, quando a estação é fixa e o dia é aleatório
, tenho, (1|station:day)
mas desta vez espero que leia a interação entre estação e dia. Parece que eu poderia usar o station * day para explicar os efeitos individuais de station e day, bem como sua interação (em vez de incluir cada um dos três termos separadamente, como faço acima), mas não vejo como especificar isso quando um é fixo e o outro é aleatório. Faria station*(1|day)
isso?
# 3 A interação entre tow e day (ambos aleatórios) quando o tow é aninhado na estação (fixo)
Então, finalmente, eu tenho o (1|tow:day)
que espero ler a interação de tow
e day
, mas estou me perguntando se preciso especificar novamente que o tow está aninhado (implicitamente) na estação?
Eu sou novo para ambos R
e lmer
e modelagem estatística e aprecio muito o trabalho de explicações detalhadas em todas as respostas às minhas perguntas, se possível.
Mais detalhes sobre meus dados: pergunto se as concentrações de plâncton variam em uma frente física no oceano próximo à costa. Eu tenho três estações, costeiras, internas e externas desta frente. A estação é assim fixa. Em cada estação, tomo três rebocadores de plâncton replicados (dos quais ordeno, conto e obtenho uma concentração em termos de # de insetos por metro em cubos de água). O reboque é aleatório: em três reboques, espero explicar a variabilidade geral do plâncton naquela estação em particular. O reboque é intrinsecamente aninhado na estação, pois cada reboque não possui um ID exclusivo (123,123,123 é o ID dos rebocadores em cada estação). Fiz isso em vários dias independentes, com uma nova frente que se formara. Acho que consigo pensar em Day como um fator de bloqueio? O dia é aleatório, pois repetir isso em vários dias independentes da frente está tentando capturar a variabilidade de um dia para o outro e ser representativo de todos os dias em que essa frente está presente. Eu quero saber sobre os termos de interação para ver se as mudanças mudam na variabilidade de um dia para o outro e se as estações sempre produzem dados semelhantes ou isso depende do dia?
Mais uma vez, obrigado pelo seu tempo e ajuda, agradeço!
R
sintaxe, na IMO, é suficientemente estatístico (por entender errado como o modelo especificado se relaciona com aninhamento e interações etc.) para estar no tópico para CV.
lmer()
sintaxe, você especificou um modelo em que há um efeito fixo de station
e quatro interceptações aleatórias, compartilhadas por indivíduos com a mesma (1) combinação de station
e tow
(2) valor de Day
, (3) combinação de station
e day
e ( 4) combinação de tow
e day
, respectivamente. É isso que você pretendia? Não tenho certeza porque, como indicado por @BabekP, como você escreveu sua formulação de modelo não está claro. Você escreveu nomes de variáveis, não parâmetros. Normalmente, em um modelo como este, as combinações de variáveis são capturadas pelos subscritos.