Eu me deparei com várias questões práticas ao modelar dados de contagem de pesquisas experimentais usando um experimento dentro do assunto. Descrevo brevemente o experimento, os dados e o que fiz até agora, seguidos pelas minhas perguntas.
Quatro filmes diferentes foram exibidos para uma amostra de entrevistados em sequência. Após cada filme, foi realizada uma entrevista, da qual contamos o número de ocorrências de determinadas afirmações que eram de interesse para o RQ (variável de contagem prevista). Também registramos o número máximo de ocorrências possíveis (unidades de codificação; variável de deslocamento). Além disso, várias características dos filmes foram medidas em escala contínua, das quais, para uma, temos uma hipótese causal de um efeito da característica do filme na contagem de afirmações enquanto as outras são controladoras (preditores).
A estratégia de modelagem adotada até o momento é a seguinte:
Estime um modelo de Poisson de efeito aleatório, em que a variável causal é usada como covariável e as outras variáveis como covariáveis de controle. Este modelo possui um deslocamento igual a 'log (unidades)' (unidades de codificação). Efeitos aleatórios são obtidos entre os assuntos (as contagens específicas do filme são aninhadas nos assuntos). Encontramos a hipótese causal confirmada (coeficiente sig. Da variável causal). Na estimativa, usamos o pacote lme4 em R, em particular a função glmer.
Agora eu tenho as seguintes perguntas. Um problema comum na regressão de Poisson é a super-dispersão. Eu sei que isso pode ser testado usando uma regressão binomial negativa e avaliando se seu parâmetro de dispersão melhora o ajuste do modelo de um modelo simples de Poisson. No entanto, não sei como fazer isso em um contexto de efeito aleatório.
- Como devo testar a sobredispersão na minha situação? Testei a super-dispersão em uma regressão binomial negativa / Poisson simples (sem efeitos aleatórios) que eu sei como ajustar. O teste sugere presença de sobredispersão. No entanto, como esses modelos não levam em consideração o cluster, acho que esse teste está incorreto. Também não tenho certeza sobre o papel do deslocamento para testes de superdispersão.
- Existe algo como um modelo de regressão binomial de efeito aleatório negativo e como devo ajustá-lo em R?
- Você tem sugestões de modelos alternativos que eu deveria experimentar com os dados, ou seja, levando em conta a estrutura de medidas repetidas, contar variáveis e exposição (unidades de codificação)?