Eu tenho um conjunto de dados que contém o número de ações executadas por indivíduos ao longo de sete dias. A ação específica não deve ser relevante para esta pergunta. Aqui estão algumas estatísticas descritivas para o conjunto de dados:
Aqui está um histograma dos dados:
A julgar pela fonte dos dados, imaginei que caberia em uma distribuição de Poisson. No entanto, a variação mean média e o histograma são fortemente ponderados para a esquerda. Além disso, executei o goodfit
teste em R e obtive:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
O método de máxima verossimilhança também produziu p-value = 0. Supondo que a hipótese nula seja: os dados correspondem a uma distribuição Poisson (a documentação não especifica isso), o goodfit
teste diz que devemos rejeitar a hipótese nula, portanto, os dados não coincidir com uma distribuição de Poisson.
Essa análise está correta? Em caso afirmativo, que distribuição você acha que caberá nesses dados?
Meu objetivo final é comparar o número médio de ações entre duas amostras para ver se as médias são diferentes; a verificação da distribuição é necessária? Meu entendimento é que os testes típicos (testes z-, t-, ) não funcionam para distribuições de Poisson. Que teste devo usar se os dados forem realmente distribuídos por Poisson?