Estou tentando modelar dados de contagem em R que aparentemente estão sub-dispersos (parâmetro de dispersão ~ 0,40). Este é provavelmente por isso que um glm
com family = poisson
ou um binômio negativo ( glm.nb
modelo) não são significativas. Quando olho para as descrições dos meus dados, não tenho a inclinação típica dos dados de contagem e os resíduos nas minhas duas condições experimentais também são homogêneos.
Então, minhas perguntas são:
Eu tenho mesmo que usar análises de regressão especiais para meus dados de contagem, se meus dados de contagem não se comportarem realmente como dados de contagem? Às vezes, enfrento a não normalidade (geralmente devido à curtose), mas usei o método de bootstrap de percentil para comparar médias aparadas (Wilcox, 2012) para explicar a não normalidade. Os métodos para dados de contagem podem ser substituídos por qualquer método robusto sugerido por Wilcox e realizado no pacote WRS?
Se eu tiver que usar análises de regressão para dados de contagem, como contabilizo a sub-dispersão? A distribuição de Poisson e a distribuição binomial negativa assumem uma maior dispersão, de modo que não deve ser apropriado, certo? Eu estava pensando em aplicar a distribuição quase-Poisson , mas isso geralmente é recomendado para a dispersão excessiva. Eu li sobre modelos beta-binomiais que parecem ser responsáveis por super e sub-dispersão, estão disponíveis no
VGAM
pacote de R. Os autores, no entanto, parecem recomendar uma distribuição Poisson reduzida , mas não consigo encontrá-la no pacote. .
Alguém pode recomendar um procedimento para dados sub-dispersos e talvez fornecer algum código R de exemplo para ele?