Percorri vários livros (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill, etc.) e vários artigos (Gelman, Jusko, Primo & Jacobsmeier, etc.), e ainda não entendi direito as principais diferenças entre o uso de erros padrão em cluster versam a modelagem multinível.
Eu entendo as partes que têm a ver com a questão da pesquisa em questão; existem certos tipos de respostas que você só pode obter da modelagem multinível. No entanto, por exemplo, para um modelo de dois níveis em que seus coeficientes de interesse estão apenas no segundo nível, qual é a vantagem de fazer um método sobre o outro? Nesse caso, não estou preocupado em fazer previsões ou extrair coeficientes individuais para clusters.
A principal diferença que pude encontrar é que os erros padrão em cluster sofrem quando os clusters têm tamanhos de amostra desiguais e que a modelagem multinível é fraca, pois assume uma especificação da distribuição aleatória do coeficiente (enquanto o uso de erros padrão em cluster é livre de modelo) .
E, no final, tudo isso significa que, para modelos que poderiam usar ostensivamente qualquer um dos métodos, deveríamos obter resultados semelhantes em termos de coeficientes e erros padrão?
Quaisquer respostas ou recursos úteis serão muito apreciados.