Aproximação simples da distribuição cumulativa de Poisson na cauda longa?


10

Eu quero decidir a capacidade de uma tabela para que ela tenha chances residuais menores que para transbordar para um dado , assumindo que o número de entradas siga uma lei de Poisson com uma dada expectativa .C2pp[40120]E[1031012]

Idealmente, quero o número inteiro mais baixo de Ctal modo que 1-CDF[PoissonDistribution[E],C] < 2^-pfor dado pe E; mas estou contente com um Cpouco mais alto que isso. O Mathematica é bom para computação manual, mas eu gostaria de calcular a Cpartir pe Eem tempo de compilação, o que me limita à aritmética de número inteiro de 64 bits.

Atualização: No Mathematica (versão 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]está 1231e parece certo (obrigado @Procrastinator); no entanto, o resultado para ambos p = 50e p = 60é 1250, o que é errado do lado inseguro (e importa: meu experimento se repete como vezes ou mais, e eu quero comprovadamente menos de chances gerais de falha). Eu quero alguma aproximação bruta, mas segura, usando apenas aritmética de número inteiro de 64 bits , como disponível em C (++) em tempo de compilação.225230


11
Que tal C = Quantile[PoissonDistribution[E],1-2^p]?

11
O termo principal da função de massa de probabilidade do Poisson domina na cauda.
cardeal

11
@ Procrastinator: sim, que funciona no Mathematica (exceto problemas de sinal pe precisão, nomes Ee Creservados). MAS preciso de uma aproximação simples disso, possivelmente bruta (mas no lado seguro), usando apenas aritmética de número inteiro de 64 bits!
fgrieu

3
Re a atualização: O Mathematica 8 retorna 1262 para e 1290 para . Re Aproximação normal (@Proc): não se pode esperar que funcione bem nas caudas, o que é crucial para o cálculo. p=50p=60
whuber

11
Talvez você deva perguntar sobre o stackoverflow. Não estou familiarizado com as restrições que você tem. Não sei o que o impede de usar a alocação dinâmica de memória, ou se você pode usar a ramificação para decidir o tamanho da matriz ou quais são os custos de definir uma matriz com o dobro do tamanho necessário (e depois não usar todos os ). Se alguma função como (apenas como exemplo) forneceu você a resposta exata, você seria capaz de implementar uma aproximação sob suas restrições ou não? Parece um problema de programação agora. μ+loglogμlogμμ+pμlogμ
Douglas Zare

Respostas:


10

Uma distribuição de Poisson com média alta é aproximadamente normal, mas é preciso ter cuidado para que você queira um rabo preso e a aproximação normal seja proporcionalmente menos precisa perto dos rabos.

Uma abordagem usada nesta questão MO e com distribuições binomiais é reconhecer que a cauda diminui mais rapidamente que uma série geométrica, para que você possa escrever um limite superior explícito como uma série geométrica.

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

A linha 2 linha 3 estava relacionada à fórmula de Stirling. Na prática, acho que você deseja resolver numericamente usando a pesquisa binária. O método de Newton começando com um palpite inicial detambém deve funcionar.plog2=log(bound)D=μ+cμ.

Por exemplo, com e , a solução numérica que recebo é 1384.89. Uma distribuição de Poisson com média leva os valores de a com probabilidadeOs valores de a ocorrem com probabilidadep=100μ=100010000138411/2100.06.0138311/299.59.


11
+1. Outra abordagem relaciona as probabilidades de cauda de Poisson (à direita) às probabilidades de cauda de distribuições Gamma (à esquerda), que podem ser estimadas de perto (acima) com uma aproximação do ponto de sela.
whuber

Há um longo caminho desde algo restrito à aritmética de número inteiro de 64 bits (sem exp, log, sqrt ..), mas vou trabalhar nisso; obrigado a todos!
fgrieu

(+1) Até a invocação da aproximação de Stirling (que é irrelevante), esse é exatamente o limite que eu estava (opaca) referenciando em meu comentário ao OP. (Por exemplo, veja aqui .)
cardeal

2

Você pode ver P. Harremoës: limites agudos nas probabilidades de cauda para variáveis ​​aleatórias de Poisson https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf As principais desigualdades são as seguintes. Seja uma variável aleatória de Poisson com o parâmetro . Coloque Let denota a função de distribuição cumulativa para a lei normal padrão. Então, para todo número inteiro , que é equivalente a para todo o inteiroYλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0. Além disso, que implica que para todo o número inteiro .Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0


Se você pudesse escrever a equação chave (supondo que haja apenas uma ou duas) que ajudaria caso o link se esgotasse em algum momento.
jbowman
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.