Verificando se duas amostras de Poisson têm a mesma média


30

Esta é uma pergunta elementar, mas não consegui encontrar a resposta. Eu tenho duas medidas: n1 eventos no tempo t1 e n2 eventos no tempo t2, ambos produzidos (digamos) por processos de Poisson com valores lambda possivelmente diferentes.

Na verdade, isso é de um artigo de notícias, que afirma essencialmente que, desde os dois são diferentes, mas não tenho certeza de que a reivindicação seja válida. Suponha que os períodos não tenham sido escolhidos com intuito malicioso (para maximizar os eventos em um ou outro).n1/t1n2/t2

Posso apenas fazer um teste t ou isso não seria apropriado? O número de eventos é muito pequeno para eu chamar confortavelmente as distribuições aproximadamente normais.



11
Espécime finas de jornalismo científico, lá ...
Matt Parker

11
Sim ... você pode ver porque eu queria verificar as estatísticas usadas.
Charles

Respostas:


25

Para testar a média de Poisson, o método condicional foi proposto por Przyborowski e Wilenski (1940). A distribuição condicional de X1 dada X1 + X2 segue uma distribuição binomial cuja probabilidade de sucesso é uma função da razão dois lambda. Portanto, procedimentos de teste de hipóteses e estimativa de intervalos podem ser facilmente desenvolvidos a partir dos métodos exatos para fazer inferências sobre a probabilidade de sucesso binomial. Geralmente, dois métodos são considerados para esse fim,

  1. Teste C
  2. E-test

Você pode encontrar os detalhes sobre esses dois testes neste documento. Um teste mais poderoso para comparar duas médias de Poisson


4
+1 Boa referência, obrigado. O teste C é uma versão mais rigorosa da que eu esbocei, portanto vale a pena considerar. O teste E relaciona uma estatística t a uma distribuição apropriada. O cálculo dessa distribuição envolve uma soma infinita dupla que levará os cálculos de a convergir: bastante fácil de codificar, provavelmente um exagero para verificar o jornal! O(n1n2)
whuber

11
O autor do artigo de teste E escreveu uma implementação simples do fortran para calcular valores-p para duas médias de poisson aqui: ucs.louisiana.edu/~kxk4695 Eu levei o fortran para o MATLAB aqui git.io/vNP86
AndyL

11

E se:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Este é um teste que compara as taxas de Poisson de 1 e 2 e fornece um valor de p e um intervalo de confiança de 95%.


Deve-se notar que, para um problema de duas amostras, isso usa um teste binomial para comparar taxas
Jon

10

Você está procurando uma verificação rápida e fácil.

λt=t1 1+t2[0 0,t1 1]n1 1[t1 1,t1 1+t2]n2

λ^=n1 1+n2t1 1+t2

nEutEuλ^nEu


11
Obrigado (+1), é a verificação certa para esse tipo de coisa inusitada. Acabou sendo altamente significativo (p = 0,005), portanto o artigo está correto. Espero que você não se importe, porém, de ter aceito a outra resposta - é bom saber a maneira 'real' de fazê-lo quando for necessário.
Charles

5

Eu estaria mais interessado em um intervalo de confiança do que um valor ap, aqui está uma aproximação de autoinicialização.

Calculando primeiro os comprimentos dos intervalos e uma verificação:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Essa verificação fornece um resultado ligeiramente diferente (aumento de 100,03%) do que o da publicação (aumento de 101%). Continue com o bootstrap (faça duas vezes):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

O intervalo de confiança de 95% do aumento é de 31% a 202%.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.