Seja denotem a resposta e o vetor preditor (respectivamente) do aluno i na escola j .yij,xijij
(1) Para dados binários, acho que a maneira padrão de fazer decomposições de variância análogas às feitas para dados contínuos é o que os autores chamam de Método D (comentarei sobre os outros métodos abaixo) em seu link - visualizando os dados binários como resultante de uma variável contínua subjacente que é governada por um modelo linear e decompõe a variação nessa escala latente. A razão é que os modelos logísticos (e outros GLMs) surgem naturalmente dessa maneira--
Para ver esta, definir de tal modo que é regulada por um modelo misto linear:y⋆ij
y⋆ij=α+xijβ+ηj+εij
onde são coeficientes de regressão, η j ∼ N ( 0 , σ 2 ) é o efeito aleatório no nível da escola e ε i j é o termo de variação residual e tem uma distribuição logística padrão . Agora deixeα,βηj∼N(0,σ2)εij
yeu j= ⎧⎩⎨⎪⎪10 0se y ⋆eu j≥ 0se y ⋆eu j< 0
deixe agora, simplesmente usando o CDF logístico que temospeu j= P( yeu j= 1 | xeu j, ηj)
peu j= 1 - P( y⋆eu j< 0 | xeu j, ηj) = exp{ - ( α + xeu jβ + ηj) }1 + exp{ - ( α + xeu jβ + ηj) }
agora, transformando o logit de ambos os lados, você tem
registro( peu j1 - peu j) =α+ xeu jβ + ηj
que é exatamente o modelo logístico de efeitos mistos. Portanto, o modelo logístico é equivalente ao modelo de variável latente especificado acima. Uma observação importante:
- A escala de não é identificada, pois, se você a reduzisse, mas fosse constante s , isso mudaria simplesmente o acima paraεeu js
exp{ - ( α + xeu jβ + ηj) / s }1 + exp{ - ( α + xeu jβ + ηj) / s }
portanto, os coeficientes e efeitos aleatórios seriam simplesmente aumentados pela quantidade correspondente. Assim, s = 1 é utilizado, o que implica v um r ( ε i J ) = π 2 / 3 .
s = 1v a r ( εeu j) = π2/ 3
Agora, se você usar esse modelo e depois a quantidade
σ^2ησ^2η+ π2/ 3
estima a correlação intraclasse das variáveis latentes subjacentes . Outra nota importante:
- εeu j
σ^2ησ^2η+ 1
Em relação aos outros métodos mencionados no documento que você vinculou:
xeu j
(B) O método de simulação é intuitivamente atraente para um estatístico, pois forneceria uma decomposição de variação estimada na escala original dos dados, mas, dependendo da audiência, pode (i) ser complicado descrever isso nos seus "métodos" (ii) pode desativar um revisor que estava procurando algo "mais padrão"
(C) Fingir que os dados são contínuos provavelmente não é uma boa idéia, embora não tenha um desempenho terrível se a maioria das probabilidades não for muito próxima de 0 ou 1. Mas, fazer isso certamente levaria uma bandeira vermelha a um revisor então eu ficaria longe.
Agora finalmente
(2) Se os efeitos fixos são muito diferentes ao longo dos anos, você tem razão em pensar que pode ser difícil comparar as variações aleatórias de efeitos ao longo dos anos, pois elas estão potencialmente em escalas diferentes (isso está relacionado à não identificabilidade do problema de dimensionamento mencionado acima).
Se você deseja manter os efeitos fixos ao longo do tempo (no entanto, se os vir mudando muito ao longo do tempo, talvez não queira fazer isso), mas observe a alteração na variação de efeito aleatório, você poderá explorar esse efeito usando algumas opções aleatórias. inclinações e variáveis fictícias. Por exemplo, se você quiser ver se os ICCs são diferentes em anos diferentes, você pode deixarEuk= 1k
α + xeu jβ + η1 jEu1+ η2 jEu2+ η3 jEu3+ η4 jEu4+ η5 jEu5+ η6 jEu6
isso fornecerá ICCs diferentes a cada ano, mas os mesmos efeitos fixos. Pode ser tentador usar apenas uma inclinação aleatória no tempo, tornando seu preditor linear
α + xeu jβ + η1+ η2t
mas não recomendo isso, pois isso permitirá que suas associações aumentem com o tempo, e não diminuam .