Receio ter a resposta sutil e talvez insatisfatória de que é uma escolha subjetiva do pesquisador ou analista de dados. Como mencionado em outra parte deste segmento, não basta dizer que os dados têm uma "estrutura aninhada". Para ser justo, porém, é assim que muitos livros descrevem quando usar modelos multiníveis. Por exemplo, acabei de puxar o livro Multinevel Analysis de Joop Hox da minha estante, o que fornece esta definição:
Um problema multinível refere-se a uma população com uma estrutura hierárquica.
Mesmo em um bom livro, a definição inicial parece circular. Eu acho que isso se deve parcialmente à subjetividade de determinar quando usar que tipo de modelo (incluindo um modelo multinível).
Outro livro, West, Welch e Lineck Mixed Models de Galecki, diz que esses modelos são para:
variáveis de resultado nas quais os resíduos são normalmente distribuídos, mas podem não ser independentes ou ter variação constante. Os desenhos de estudos que levam a conjuntos de dados que podem ser analisados adequadamente usando LMMs incluem (1) estudos com dados agrupados, como alunos em salas de aula, ou desenhos experimentais com blocos aleatórios, como lotes de matéria-prima para um processo industrial e (2) estudos longitudinais ou de medidas repetidas, nos quais os indivíduos são medidos repetidamente ao longo do tempo ou sob diferentes condições.
Finch, Bolin e Kelley Multilevel Modeling in R também falam sobre violar a suposição iid e resíduos correlatos:
De particular importância no contexto da modelagem multinível é a suposição [na regressão padrão] de termos de erro distribuídos independentemente para as observações individuais em uma amostra. Essa suposição significa essencialmente que não há relações entre os indivíduos na amostra para a variável dependente, uma vez que as variáveis independentes na análise são contabilizadas.
Acredito que um modelo multinível faz sentido quando há motivos para acreditar que as observações não são necessariamente independentes uma da outra. Qualquer que seja o "cluster" responsável por essa não independência pode ser modelado.
Um exemplo óbvio seriam as crianças nas salas de aula - todas elas estão interagindo umas com as outras, o que pode levar a que os resultados dos testes não sejam independentes. E se uma sala de aula tiver alguém que faça uma pergunta que faça com que o material seja coberto nessa classe que não seja coberto em outras classes? E se o professor estiver mais acordado para algumas aulas do que para outras? Nesse caso, haveria alguma não independência de dados; em palavras multinível, poderíamos esperar que alguma variação na variável dependente se devesse ao cluster (ou seja, classe).
Seu exemplo de um cão versus um elefante depende das variáveis de interesse independentes e dependentes, eu acho. Por exemplo, digamos que estamos perguntando se existe um efeito da cafeína no nível da atividade. Animais de todo o zoológico são designados aleatoriamente para obter uma bebida com cafeína ou uma bebida de controle.
Se somos um pesquisador interessado em cafeína, podemos especificar um modelo multinível, porque realmente nos preocupamos com o efeito da cafeína. Este modelo seria especificado como:
activity ~ condition + (1+condition|species)
Isso é particularmente útil se houver um grande número de espécies sobre as quais estamos testando essa hipótese. No entanto, um pesquisador pode estar interessado nos efeitos específicos da espécie da cafeína. Nesse caso, eles poderiam especificar espécies como um efeito fixo:
activity ~ condition + species + condition*species
Obviamente, isso é um problema se houver, digamos, 30 espécies, criando um design 2 x 30 pesado. No entanto, você pode ser bastante criativo com a forma como modelamos esses relacionamentos.
Por exemplo, alguns pesquisadores estão defendendo um uso ainda mais amplo da modelagem multinível. Gelman, Hill e Yajima (2012) argumentam que a modelagem multinível poderia ser usada como uma correção para múltiplas comparações - mesmo em pesquisas experimentais em que a estrutura dos dados não é obviamente de natureza hierárquica:
Problemas mais difíceis surgem ao modelar várias comparações que possuem mais estrutura. Por exemplo, suponha que tenhamos cinco medidas de resultado, três variedades de tratamentos e subgrupos classificados por dois sexos e quatro grupos raciais. Não gostaríamos de modelar essa estrutura 2 × 3 × 4 × 5 como 120 grupos intercambiáveis. Mesmo nessas situações mais complexas, acreditamos que a modelagem multinível deve e eventualmente substituirá os procedimentos clássicos de comparações múltiplas.
Os problemas podem ser modelados de várias maneiras e, em casos ambíguos, várias abordagens podem parecer atraentes. Penso que o nosso trabalho é escolher uma abordagem razoável e informada e fazê-lo de forma transparente.