Qual é o modelo apropriado para dados de contagem sub-dispersos?


24

Estou tentando modelar dados de contagem em R que aparentemente estão sub-dispersos (parâmetro de dispersão ~ 0,40). Este é provavelmente por isso que um glmcom family = poissonou um binômio negativo ( glm.nbmodelo) não são significativas. Quando olho para as descrições dos meus dados, não tenho a inclinação típica dos dados de contagem e os resíduos nas minhas duas condições experimentais também são homogêneos.

Então, minhas perguntas são:

  1. Eu tenho mesmo que usar análises de regressão especiais para meus dados de contagem, se meus dados de contagem não se comportarem realmente como dados de contagem? Às vezes, enfrento a não normalidade (geralmente devido à curtose), mas usei o método de bootstrap de percentil para comparar médias aparadas (Wilcox, 2012) para explicar a não normalidade. Os métodos para dados de contagem podem ser substituídos por qualquer método robusto sugerido por Wilcox e realizado no pacote WRS?

  2. Se eu tiver que usar análises de regressão para dados de contagem, como contabilizo a sub-dispersão? A distribuição de Poisson e a distribuição binomial negativa assumem uma maior dispersão, de modo que não deve ser apropriado, certo? Eu estava pensando em aplicar a distribuição quase-Poisson , mas isso geralmente é recomendado para a dispersão excessiva. Eu li sobre modelos beta-binomiais que parecem ser responsáveis ​​por super e sub-dispersão, estão disponíveis no VGAMpacote de R. Os autores, no entanto, parecem recomendar uma distribuição Poisson reduzida , mas não consigo encontrá-la no pacote. .

Alguém pode recomendar um procedimento para dados sub-dispersos e talvez fornecer algum código R de exemplo para ele?


1
Como você sabe que seus dados estão sub-dispersos? Como você está calculando o parâmetro de dispersão?
Hong Ooi 14/08/13

1
Também ajudaria a nos dizer mais sobre o que você está interessado. Para estimativas lineares de pontos preditores e previsão de valores, a subdispersão raramente é um problema, mas testes e intervalos podem ser desnecessariamente conservadores (quase famílias ajudariam nisso). Dito isto, para uma abordagem de probabilidade "normal", verifique o COM Poisson e outros modelos generalizados de Poisson.
Momo

@ Hung Ooi: testei a dispersão com o teste de dispersão (Poissonmodel, alternativa = c ("less")) e o teste foi significativo.
Sil

1
@ Momo: eu quero testar se as díades de negociação em duas condições experimentais diferem nas ofertas corretas que fazem. Ofertas corretas significam que as díades reivindicam mais questões que correspondem aos interesses respectivos de suas equipes, em vez de reivindicar questões mais valiosas para a outra parte. Primeiro, eu nem sabia que eram dados de contagem. Você quer dizer Distribuição de Conway-Maxwell-Poisson por COM Poisson? Muito obrigado já!
Sil

3
Obrigado pela informação adicional. Sim, eu quis dizer o conway-maxwell poisson. A Shmueli & co desenvolveu um tipo de modelo linear generalizado para ele; também há um pacote R, se você quiser experimentar.
Momo

Respostas:


9

A melhor maneira --- e padrão de lidar com dados Poisson sub-dispersos é usando um Poisson generalizado, ou talvez um modelo de obstáculos. Três modelos de contagem de parâmetros também podem ser usados ​​para dados sub-dispersos; por exemplo, Faddy-Smith, Waring, Famoye, Conway-Maxwell e outros modelos de contagem generalizada. A única desvantagem disso é a interpretabilidade. Mas, para dados sub-dispersos gerais, deve-se usar o Poisson generalizado. É como um binômio negativo para dados superdispersos. Discuto isso detalhadamente em dois dos meus livros, Modeling Count Data (2014) e Negative Binomial Regression, 2ª edição, (2011), ambos da Cambridge University Press. Em R, o pacote VGAM permite regressão generalizada de Poisson (GP). Valores negativos do parâmetro dispersão indicam ajuste para sub-dispersão. Você pode usar o modelo GP também para dados super dispersos, mas geralmente o modelo NB é melhor. Quando se trata disso, é melhor determinar a causa da subdispersão e selecionar o modelo mais apropriado para lidar com isso.


Bem vindo de volta! Registre e / ou mescle suas contas (você pode encontrar informações sobre como fazer isso na seção Minha conta da nossa Central de Ajuda ), para poder editar e comentar sua própria pergunta. (Sua conta original está aqui .)
gung - Restabelece Monica

Você pode executar uma análise Poisson generalizada no SPSS?
Grace Carroll

3

Encontrei um Poisson pouco disperso uma vez que tinha a ver com a frequência com que as pessoas jogavam um jogo social. Aconteceu que isso se devia à extrema regularidade com que as pessoas brincavam às sextas-feiras. A remoção dos dados de sexta-feira me deu o esperado Poisson superdisperso. Talvez você tenha a opção de editar seus dados da mesma forma.


1

Há situações em que a subdispersão coalescem com inflação zero, o que é típico para crianças preferidas, contadas por indivíduos de ambos os sexos. Não encontrei uma maneira de capturar isso até o momento

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.