A soma ponderada de duas variáveis aleatórias independentes de Poisson

Usando a Wikipedia, encontrei uma maneira de calcular a função de massa de probabilidade resultante da soma de duas variáveis aleatórias de Poisson. No entanto, acho que a abordagem que tenho está errada.

Seja duas variáveis aleatórias independentes de Poisson com média e $X_1, X_2$ $\lambda_1, \lambda_2$ $S_2 = a_1 X_1+a_2 X_2$ , em que o $a_1$ e $a_2$ são constantes, em seguida, a função de probabilidade de geração de $S_2$ é dado por

G_{S_{2}} (z) = E (z^{S_{2}}) = E (z^{a_{1} X_{1} + a_{2} X_{2}}) G_{X_{1}} (z^{a_{1}}) G_{X_{2}} (z^{a_{2}}) .

$G_{S_2}(z) = \operatorname{E}(z^{S_2})= \operatorname{E}(z^{a_1 X_1+a_2 X_2}) G_{X_1}(z^{a_1})G_{X_2}(z^{a_2}).$ Agora, usando o fato de que a função geradora de probabilidade para uma variável aleatória Poisson é

G_{X_{i}} (z) = e^{λ_{i} (z - 1)}

$G_{X_i}(z) = \textrm{e}^{\lambda_i(z - 1)}$ , podemos escrever a função geradora de probabilidade da soma das duas variáveis aleatórias independentes de Poisson. variáveis como

\begin{aligned} G_{S_{2}} (z) & = e^{λ_{1} (z^{a_{1}} - 1)} e^{λ_{2} (z^{a_{2}} - 1)} \\ = e^{λ_{1} (z^{a_{1}} - 1) + λ_{2} (z^{a_{2}} - 1)} . \end{aligned}

$\begin{aligned} G_{S_2}(z) &= \textrm{e}^{\lambda_1(z^{a_1} - 1)}\textrm{e}^{\lambda_2(z^{a_2} - 1)} \\ &= \textrm{e}^{\lambda_1(z^{a_1} - 1)+\lambda_2(z^{a_2} - 1)}. \end{aligned}$ Parece que a função de massa probabilística de

S_{2}

$S_2$ é recuperada tomando derivadas de

G_{S_{2}} (z)

$G_{S_2}(z)$

\Pr (S_{2} = k) = \frac{G_{S_{2}}^{(k)} (0)}{k!}

$\operatorname{Pr}(S_2 = k) = \frac{G_{S_2}^{(k)}(0)}{k!}$ , onde

G_{S_{2}}^{(k)} = \frac{d^{k} G_{S_{2}} (z)}{d z^{k}}

$G_{S_2}^{(k)} = \frac{d^k G_{S_2}(z)}{ d z^k}$ .

Isso está correto? Tenho a sensação de que não posso simplesmente pegar a derivada para obter a função de massa de probabilidade, devido às constantes $a_1$ e $a_2$ . Isto está certo? Existe uma abordagem alternativa?

Se isso estiver correto, agora posso obter uma aproximação da distribuição cumulativa truncando a soma infinita sobre todo k?

distributions poisson-distribution

— Michel
fonte

Por que você está escalando as summands com

? A soma é apenas mais uma distribuição de Poisson sem isso. As variáveis recebem valores nos números inteiros positivos, então algo como

vezes o primeiro mais

a_{1}

$a_1$

a_{2}

$a_2$

1

$1$

vezes o segundo geralmente não é natural e permite recuperar os valores das duas variáveis.

\sqrt{2}

$\sqrt{2}$

— Douglas Zare

A dificuldade aqui é que a menos que tanto

são inteiros, não se pode ter certeza de que

assume apenas valores inteiros. Assim, é necessário encontrar não apenas

para valores inteiros de

mas também

para cada

que pode ser expresso como

para inteiros não negativos

a_{1}

$a_1$

a_{2}

$a_2$

S_{2}

$S_2$

P (S_{2} = k)

$P(S_2 = k)$

k

$k$

P (S_{2} = α)

$P(S_2 = \alpha)$

α

$\alpha$

a_{1} m + a_{2} n

$a_1m + a_2n$

m

$m$

n

$n$

— Dilip Sarwate

@DilipSarwate Isso é possível? Existe outra abordagem para fazer isso?

— Michel

@DouglasZare Eu tenho que fazer isso ... Talvez eu precise recorrer a algum tipo de método de inicialização.

— Michel

Eu não acho que você possa fazer muito melhor do que uma abordagem de força bruta que encontre os possíveis valores que

pode assumir e, para cada

, use

S_{2}

$S_2$

α

$\alpha$

Para a maioria das escolhas de

, eu esperaria que a maioria das somas irá reduzir a um único termo. Eu espero que você saiba que para

é uma variável aleatória de Poisson com parâmetro

P {S_{2} = α} = \sum_{a_{1} m + a_{2} n = α} P {X_{1} = m} P {X_{2} = n} = \sum_{a_{1} m + a_{2} n = α} \exp (- λ_{1} m) \frac{λ_{1}^{m}}{m!} \exp (- λ_{2} n) \frac{λ_{2}^{n}}{n!} .

$P\{S_2 = \alpha\} = \sum_{a_1m + a_2n = \alpha}P\{X_1=m\}P\{X_2=n\} = \sum_{a_1m + a_2n = \alpha} \exp(-\lambda_1m)\frac{\lambda_1^m}{m!}\exp(-\lambda_2n)\frac{\lambda_2^n}{n!}.$

a_{1}

$a_1$

a_{2}

$a_2$

a_{1} = a_{2} = 1

$a_1=a_2=1$

S_{2}

$S_2$

λ_{1} + λ_{2}

$\lambda_1+\lambda_2$

— Dilip Sarwate

Respostas:

Desde que não haja muita probabilidade concentrada em qualquer valor único nessa combinação linear, parece que uma expansão Cornish-Fisher pode fornecer boas aproximações ao CDF (inverso).

Lembre-se de que essa expansão ajusta o CDF inverso da distribuição normal padrão usando os primeiros cumulantes de . Sua assimetria é $S_2$ $\beta_1$

\frac{a_{1}^{3} λ_{1} + a_{2}^{3} λ_{2}}{{(\sqrt{a_{1}^{2} λ_{1} + a_{2}^{2} λ_{2}})}^{3}}

$\frac{a_1^3 \lambda_1 + a_2^3 \lambda_2}{\left(\sqrt{a_1^2 \lambda_1 + a_2^2 \lambda_2}\right)^3}$

e sua curtose é $\beta_2$

\frac{a_{1}^{4} λ_{1} + 3 a_{1}^{4} λ_{1}^{2} + a_{2}^{4} λ_{2} + 6 a_{1}^{2} a_{2}^{2} λ_{1} λ_{2} + 3 a_{2}^{4} λ_{2}^{2}}{{(a_{1}^{2} λ_{1} + a_{2}^{2} λ_{2})}^{2}} .

$\frac{a_1^4 \lambda_1 + 3a_1^4 \lambda_1^2 + a_2^4 \lambda_2 + 6 a_1^2 a_2^2 \lambda_1 \lambda_2 + 3 a_2^4 \lambda_2^2}{\left(a_1^2 \lambda_1 + a_2^2 \lambda_2\right)^2}.$

Para encontrar o percentil da versão padronizada do , calcule $\alpha$ $S_2$

w_{α} = z + \frac{1}{6} β_{1} (z^{2} - 1) + \frac{1}{24} (β_{2} - 3) (z^{2} - 3) z - \frac{1}{36} β_{1}^{2} z (2 z^{2} - 5 z) - \frac{1}{24} (β_{2} - 3) β_{1} (z^{4} - 5 z^{2} + 2)

$w_\alpha = z +\frac{1}{6} \beta _1 \left(z^2-1\right) +\frac{1}{24} \left(\beta _2-3\right) \left(z^2-3\right) z-\frac{1}{36} \beta _1^2 z \left(2 z^2-5 z\right)-\frac{1}{24} \left(\beta _2-3\right) \beta _1 \left(z^4-5 z^2+2\right)$

onde é o percentil da distribuição normal padrão. O percentil de é assim $z$ $\alpha$ $S_2$

a_{1} λ_{1} + a_{2} λ_{2} + w_{α} \sqrt{a_{1}^{2} λ_{1} + a_{2}^{2} λ_{2}} .

$a_1 \lambda_1 + a_2 \lambda_2 + w_\alpha \sqrt{a_1^2 \lambda_1 + a_2^2 \lambda_2}.$

Experimentos numéricos sugerem que essa é uma boa aproximação uma vez que e excedem ou mais. Por exemplo, considerar o caso e (dispostos de modo a dar uma média zero por conveniência): $\lambda_1$ $\lambda_2$ $5$ $\lambda_1 = 5,$ $\lambda_2=5\pi/2,$ $a_1=\pi,$ $a_2=-2$

Figura

$S_2$

— whuber
fonte

λ_{1}

$\lambda_1$

λ_{2} \leq 5

$\lambda_2 \leq 5$

Use a convolução:

$f_{X_1}(x_1)= \dfrac{\lambda^{x_1}e^{-\lambda}}{x_1!}$ $x_1 \geq 0$ $f_{X_1}(x_1)= 0$ $f_{X_2}(x_2)=\dfrac{\lambda^{x_2}e^{-\lambda}}{x_2!}$ $x_2 \geq 0$ $f_{X_2}(x_2)= 0$

$Z=X_1+X_2\rightarrow X_1=Z-X_2$

f_{Z} (z) = \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} f_{x_{1}, x_{2}} (z - x_{2}, x_{2}) d x_{1} d x_{2}

$f_Z(z)=\int\limits_{-\infty}^{\infty}\int\limits_{-\infty}^{\infty}f_{x_1,x_2}(z-x_2,x_2)dx_1dx_2$

$X_1$ $X_2$

f_{Z} (z) = \int_{- \infty}^{\infty} \int_{- \infty}^{\infty} f_{X_{1}} (z - x_{2}) f_{X_{2}} (x_{2}) d x_{1} d x_{2}

$f_Z(z)=\int\limits_{-\infty}^{\infty}\int\limits_{-\infty}^{\infty}f_{X_1}(z-x_2)f_{X_2}(x_2)dx_1dx_2$

f_{Z} (z) = \sum_{x_{2} = 0}^{z} \frac{λ_{1}^{z - x_{2}} e^{- λ_{1}}}{(z - x_{2})!} \frac{λ_{2}^{x_{2}} e^{- λ_{2}}}{x_{2}!}

$f_Z(z)=\sum\limits_{x_2=0}^{z} \dfrac{\lambda^{z-x_{2}}_1e^{-\lambda_1}}{(z-x_2)!}\dfrac{\lambda^{x_2}_2e^{-\lambda_2}}{x_2!}$

= e^{- (λ_{1} + λ_{2})} \frac{(λ_{1} + λ_{2})^{z}}{z!}

$= e^{-(\lambda_1+\lambda_2)}\dfrac{(\lambda_1+\lambda_2)^z}{z!}$

λ_{1} + λ_{2}

$\lambda_1+\lambda_2$

— QAChip
fonte

a_{1} = a_{2} = 1

$a_1=a_2=1$

a_{1} = a_{2}

$a_1 = a_2$

a_{1} \neq a_{2}

$a_1 \ne a_2$

S = \sum_{i = 1}^{N} X_{i}

$S = \sum_{i=1}^N X_i$

N

$N$

X_{i}

$X_i$

i i d

$iid$

N

$N$

X_{i} = k

$X_i=k$

k N

$k N$

k

$k$

N

$N$

E [s^{k N}] = E [(s^{k})^{N}] = G_{N} (s^{k}) = \exp (λ (s^{k} - 1))

$E[s^{k N}] = E[(s^{k})^N] = G_N(s^{k}) = \exp(\lambda(s^k-1))$

Z = k_{1} N_{1} + k_{2} N_{2}

$Z = k_1 N_1 + k_2 N_2$

G_{Z} (s) = \exp (λ_{1} (s^{k_{1}} - 1) + λ_{2} (s^{k_{2}} - 1)) .

$G_Z(s) = \exp(\lambda_1(s^{k_1}-1) + \lambda_2(s^{k_2}-1)).$

λ = λ_{1} + λ_{2}

$\lambda = \lambda_1 + \lambda_2$

G_{Z} (s) = \exp (λ (\frac{λ_{1}}{λ} (s^{k_{1}} - 1) + \frac{λ_{2}}{λ} (s^{k_{1}} - 1)) = \exp (λ (\frac{λ_{1}}{λ} s^{k_{1}} + \frac{λ_{2}}{λ} s^{k_{1}} - 1)) .

$G_Z(s) = \exp(\lambda ( \frac{\lambda_1}{\lambda}(s^{k_1}-1)+ \frac{\lambda_2}{\lambda}(s^{k_1}-1)) = \exp(\lambda (\frac{\lambda_1}{\lambda}s^{k_1}+ \frac{\lambda_2}{\lambda}s^{k_1}-1)).$

λ = λ_{1} + λ_{2}

$\lambda = \lambda_1 + \lambda_2$

X_{i}

$X_i$

k_{1}

$k_1$

λ_{1} / λ

$\lambda_1/\lambda$

k_{2}

$k_2$

λ_{2} / λ

$\lambda_2/\lambda$

$k_1$ $k_2$ $0$

Edite após uma discussão:

Eu acho que o melhor que você pode fazer é MC. Você pode usar a derivação de que este é um composto Poisson distr.

$Pois(\lambda)$
$i=1,\ldots,N$ $X_1$ $X_2$ $\lambda_1/\lambda$ $\lambda_1/\lambda$ $1$ $k_1$ $k_2$

Você terá uma amostra de, digamos, 100 000 em segundos.

Como alternativa, você pode experimentar as duas somas em sua representação inicial separadamente ... isso será o mais rápido.

Tudo o resto (FFT) é complicado se os fatores constantes k1 e k2 forem totalmente gerais.

— Ric
fonte

E a distribuição final pode ser encontrada pelo algoritmo Panjer se os fatores forem inteiros.

— Ric

G_{S_{2}} (z) = e^{λ_{1} (z^{a_{1}} - 1)} e^{λ_{2} (z^{a_{2}} - 1)}

$G_{S_2}(z) = \textrm{e}^{\lambda_1(z^{a_1} - 1)}\textrm{e}^{\lambda_2(z^{a_2} - 1)}$

a_{1}, a_{2} \in R^{1}

$a_1,a_2 \in R^1$

P {S_{2} = α} = \sum_{a_{1} m + a_{2} n = α} P {X_{1} = m} P {X_{2} = n} = \sum_{a_{1} m + a_{2} n = α} \exp (- λ_{1} m) \frac{λ_{1}^{m}}{m!} \exp (- λ_{2} n) \frac{λ_{2}^{n}}{n!},

$P\{S_2 = \alpha\} = \sum_{a_1m + a_2n = \alpha}P\{X_1=m\}P\{X_2=n\} = \sum_{a_1m + a_2n = \alpha} \exp(-\lambda_1m)\frac{\lambda_1^m}{m!}\exp(-\lambda_2n)\frac{\lambda_2^n}{n!},$

a_{1}, a_{2}

$a_1,a_2$

Olá Michel, editei minha resposta. Sim Panjer é de uso limitado. Mas você pode tentar uma abordagem de transformação de Fourier. No entanto unidades não inteiras são problemáticas ... Eu tenho que pensar mais sobre o que fazer neste caso. De qualquer forma, é importante observar que o resultado é uma distribuição Poisson composta (não uma distribuição Poisson "simples").

— 09 de Ric

P r (S_{2} = x) = \frac{1}{2 π} \int_{R} e^{- i t x} G_{S 2} (e^{i t}) d t

$Pr(S_2=x) = \frac{1}{2\pi}\int_{\mathbf{R}} e^{-itx}G_{S2}(\mathrm{e}^{it})dt$

Algo no caminho ... Se tivéssemos uma distribuição contínua da qual podemos calcular a função característica (como você faz), isso leva a um resultado rápido e agradável. No nosso caso, preciso de mais tempo para pensar sobre isso. Deveria haver algo mais fácil.

— 10393 Ric

A soma ponderada de duas variáveis ​​aleatórias independentes de Poisson

A soma ponderada de duas variáveis aleatórias independentes de Poisson