O número de somas exponenciais em um intervalo fixo é Poisson

Qual é a maneira mais inteligente de provar que o número de somas exponenciais independentes em um intervalo fixo é distribuído como uma variável aleatória de Poisson? Eu posso fazer isso de uma maneira, mas gostaria de saber se existe outra maneira de obter mais pontos de estilo.

Deixe . Só para esclarecer, as densidades são cada . Agora, para , defina . $S_1, S_2, \ldots \overset{iid}{\sim} \text{Exponential}(\mu)$ $f_S(s) = \mu e^{-\mu s}$ $t > 0$ $K_t = \{j : S_1 + \cdots S_j < t < S_1 + \cdots + S_j + S_{j+1}\}$

O jeito que eu posso fazer isso é integrando diretamente a densidade articular dos exponenciais. Por exemplo, Mas existe outro caminho?

P (K_{t} = 1) = P (S_{1} < t < S_{1} + S_{2}) = \int_{0}^{t} \int_{t - s_{1}}^{\infty} μ e^{- μ s_{1}} μ e^{- μ s_{2}} d s_{2} d s_{1} = (μ t) e^{μ t} .

$P(K_t = 1) = P(S_1 < t < S_1 + S_2) = \int_0^t \int_{t-s_1}^{\infty} \mu e^{-\mu s_1}\ \mu e^{-\mu s_2}\ ds_2\ ds_1 = (\mu t) e^{\mu t}.$

Edit: Este é um resultado bem conhecido dos processos básicos de Poisson. Este fato foi motivação para a pergunta. Portanto, idealmente, as respostas não contarão com nenhum resultado de Poisson ou de outros processos estocásticos.

poisson-distribution exponential queueing

— Taylor
fonte

Proponho tomar, como ponto de partida, o conceito de um processo homogêneo de Poisson . Este é um processo pontual na linha (geralmente pensado e referido como uma linha do "tempo"). As realizações são conjuntos de pontos. Quase certamente, qualquer conjunto limitado de números reais conterá apenas muitos pontos finitos.

As propriedades fundamentais desfrutadas por esse processo, as que usarei repetidamente na análise, são

( Independência ) Os resultados em quaisquer dois conjuntos disjuntos são independentes.
( Homogeneidade ) O número esperado de pontos em qualquer conjunto mensurável com medida finitaé diretamente proporcional a. A constante de proporcionalidade é diferente de zero. $\mathcal{A}$ $|\mathcal A|$ $|\mathcal{A}|$ $\lambda$

Tudo flui dessas propriedades, como veremos.

Tempos de espera

Vamos estudar os "tempos de espera" deste processo. Dado um tempo de início e duração decorrido , deixar é a probabilidade de que não há pontos ocorrer entre e : isto é, dentro do intervalo . Considere dois intervalos adjacentes, um de para e outro de para . Por independência, essa chance de nenhum ponto estar em sua união é o produto da chance de que nenhum ponto esteja no primeiro e no chance de que nenhum ponto esteja no segundo: $s$ $t \ge 0$ $S(s, t)$ $s$ $s+t$ $(s, s+t]$ $r$ $r+s$ $r+s$ $r+s+t$

\begin{matrix} (1) & S (r, s + t) = S (r, s) S (r + s, t) . \end{matrix}

$S(r, s+t) = S(r,s) S(r+s,t).\tag{1}$

Por homogeneidade, essas chances permanecem as mesmas quando deslizamos os intervalos. Ou seja, para qualquer , . Em particular, sempre podemos usar para obter $s$ $S(r, t) = S(r+s, t)$ $r=-s$

S (r, t) = S (0, t) = S (t)

$S(r, t) = S(0,t) = S(t)$

para todo , permitindo-nos eliminar a dependência explícita de na notação. Conectar isso em dá $r$ $r$ $(1)$

\begin{matrix} (2) & S (s + t) = S (s) S (t) . \end{matrix}

$S(s+t) = S(s)S(t).\tag{2}$

A homogeneidade torna óbvio que deve ser contínuo (na verdade, diferenciável). É sabido que as únicas soluções para são exponenciais. Uma maneira simples de entender isso é considerar que o logaritmo de é linear e, como , consequentemente, deve haver algum número para o qual $S$ $(2)$ $S$ $S(0)=1$ $\kappa$

\log (S (t)) = κ t .

$\log(S(t)) = \kappa t.$

Como deve diminuir com o passar do tempo, . Portanto , todas as soluções têm a forma $S$ $\kappa \lt 0$

S (t) = e^{- κ t} .

$S(t) = e^{-\kappa t}.$

É a chance de que nenhum ponto ocorra dentro de um intervalo especificado de comprimento . $t$

Somações exponenciais

Conserte um intervalo; em virtude da homogeneidade, podemos assumir que começa em e termina (digamos) em . Quase certamente há apenas um número finito de pontos do processo no intervalo , permitindo-nos pedir-lhes . é uma realização de uma variável aleatória regido por : isto é, $0$ $b$ $(0,b]$ $0 \lt t_1 \lt t_2 \lt \cdots \lt t_n$ $t_1$ $T_1$ $S$

Pr (T_{1} \leq t) = 1 - Pr (T_{1} > t) = 1 - S (t) = 1 - e^{- κ t} .

$\Pr(T_1 \le t) = 1 - \Pr(T_1 \gt t) = 1 - S(t) = 1 - e^{-\kappa t}.$

$T_2$ é similarmente uma variável aleatória independente , onde também é governada por , de onde $T_2 - T_1$ $S$

Pr (T_{2} \leq T_{1} + t) = 1 - S (t) = 1 - e^{- κ t},

$\Pr(T_2 \le T_1 + t) = 1 - S(t) = 1 - e^{-\kappa t},$

e da mesma forma para o restante . Isso demonstra que é exatamente como descrito na pergunta: é o maior número de "somas exponenciais" que se ajustam ao intervalo . É uma realização da variável aleatória $T_i$ $n$ $(0, b]$

N (0, b) = max {i | T_{1} + T_{2} + \dots + T_{i} \leq b} .

$N(0,b) = \max\{i\,|\,T_1+T_2+\cdots+T_i \le b\}.$

Distribuição de veneno

Seja um número inteiro. Qual é a chance, , de que existem exatamente pontos no intervalo ? Vou deduzir a resposta da propriedade ergódica do processo de Poisson, que considero intuitiva: porque o processo dentro do intervalo unitário é o mesmo (e independente) do processo dentro de qualquer intervalo unitário , podemos deduzir propriedades do processo variando para uma única realização e estudando os padrões de pontos que aparecem. Em particular, deve ser igual à proporção limite de tempo em que o número de pontos $k\ge 0$ $p_k$ $k$ $[0,1]$ $[0,1]$ $[t-1, t]$ $t$ $p_k$ $N(t)=N(t-1,t)$ no intervalo é igual a . Podemos expressar isso formalmente usando a função indicadora que é igual a quando seu argumento é verdadeiro e é caso contrário: $[t-1,t]$ $k$ $I$ $1$ $0$

p_{k} = lim_{x \to \infty} \frac{1}{x - 1} \int_{1}^{x} I (N (t) = k) d t .

$p_k = \lim_{x\to\infty}\frac{1}{x-1}\int_1^x I(N(t)=k) dt.$

A integral é a duração total entre e quando o intervalo contém exatamente pontos, enquanto o denominador da fração é o tempo total decorrido de a . $1$ $x$ $[t-1,t]$ $k$ $1$ $x$

Este é um gráfico de para uma realização de um processo de Poisson com taxa . Linhas horizontais brancas marcam os valores no eixo vertical, que se estende de a . As linhas verticais cinza mostram os horários em que os pontos ocorrem nessa realização. As linhas verticais azuis pontilhadas mostram os mesmos pontos deslocados uma unidade para a direita. A curva vermelha sólida representa começando em . (Ele se estende infinitamente para a direita, mas nem tudo pode ser desenhado!) $N(t)$ $\lambda=2.5$ $k=1,2,3$ $0$ $4$ $N(t)$ $t=1$

$N(1)=4$ porque quatro pontos (linhas cinzas) aparecem na primeira unidade de tempo, . A trama de , em seguida, sobe por uma unidade de cada vez outra linha cinza é encontrado se deslocam da esquerda para a direita, porque isto é, quando o intervalo pega que ponto. Ela cai em uma unidade cada vez que uma linha azul é encontrado, porque esta é a mesma coisa que perder o valor a partir do intervalo . $[0,1]$ $N(t)$ $t$ $[t-1,t]$ $t$ $t-1$ $[t-1,t]$

A proporção de tempo gasto em cada altura estima , a chance de que qualquer intervalo de unidades contenha exatamente pontos. $k$ $p_k$ $k$

Suponha que o intervalo contenha pontos. À medida que a deslizamos para a direita, vamos acompanhar os novos pontos captados e os pontos antigos que desaparecem. Duas relações simples determinam tudo: $[t-1, t]$ $k$

Entre e (para ), o número esperado de novos pontos é . (Isso é homogeneidade.) $t$ $t+dt$ $dt \ge 0$ $\lambda\, dt$
No entanto, o número esperado de pontos perdidos é porque existem pontos localizados aleatoriamente dentro do intervalo. (Isso também se deve à homogeneidade.) $k\, dt$ $k$

Quase certamente, no máximo, um ponto é adicionado ou perdido a qualquer instante. (Caso contrário, haveria um limite inferior positivo à chance de dois ou mais pontos aparecerem em intervalos arbitrariamente pequenos , mas como o número esperado de pontos nesses intervalos é apenas --que cresce incrivelmente pequeno com pequeno - isso é impossível.) Assim, existem apenas duas transições que têm chance diferente de zero: de pontos para pontos e de pontos para pontos. Suas taxas instantâneas são $[t, t+dt]$ $\lambda dt$ $dt$ $k$ $k+1$ $k$ $k-1$

τ (k \to k + 1) = lim_{d t \to 0^{+}} \frac{λ d t}{d t} = λ

$\tau(k\to k+1) =\lim_{dt\to 0^{+}} \frac{\lambda\, dt}{dt} = \lambda$

e, se , $k \ge 1$

τ (k \to k - 1) = lim_{d t \to 0^{+}} \frac{k d t}{d t} = k .

$\tau(k\to k-1) = \lim_{dt\to 0^{+}} \frac{k\, dt}{dt} = k.$

Isso pode parecer complicado, uma vez que estabelece um sistema de equações diferenciais para as infinitas probabilidades . No entanto, como o processo é homogêneo, essas probabilidades são imutáveis. $p_k$

Veja primeiro o caso . A taxa esperada na qual muda (ou seja, zero) é a taxa esperada de transições de estados com menos a taxa esperada de transições para estados com . Assim, em virtude das relações simples (1) e (2), $k=0$ $p_0$ $1\to 0$ $k=1$ $0\to 1$ $k=1$

(1) p_{1} - (λ) p_{0} = 0.

$(1)p_1 - (\lambda)p_0 = 0.$

Isso nos permite encontrar em termos de : $p_1$ $p_0$

\begin{matrix} (3) & p_{1} = λ p_{0} . \end{matrix}

$p_1 = \lambda p_0.\tag{3}$

Agora considere a situação geral . Existem quatro transições potencialmente mudança , os quais devem equilibrar na expectativa : e make-lo diminuir, enquanto que e aumentá-la . Assim, novamente usando as relações simples (1) e (2) para calcular as taxas instantâneas, $k\gt 0$ $p_k$ $k\to k+1$ $k\to k-1$ $k+1\to k$ $k-1\to k$

[(λ) p_{k - 1 1} - (k) p_{k}] + [(k + 1 1) p_{k + 1 1} - (λ) p_{k}] = 0

$[(\lambda)p_{k-1} - (k) p_k] + [(k+1)p_{k+1} - (\lambda)p_k] = 0.$

Podemos assumir indutivamente que o primeiro termo entre parênteses se equilibra (algo que acabamos de mostrar no caso ), equilibrando automaticamente o segundo termo entre parênteses e fornecendo a solução com facilidade $k=0$

\begin{matrix} 4) & p_{k + 1 1} = \frac{λ}{k + 1 1} p_{k} . \end{matrix}

$p_{k+1} = \frac{\lambda}{k+1}p_k.\tag{4}$

As fórmulas e determinam todo o em termos de : a solução é $(3)$ $(4)$ $p_k$ $p_0$

\begin{matrix} (5) & p_{k} = p_{0 0} \frac{λ^{k}}{k!} . \end{matrix}

$p_k = p_0\frac{\lambda^k}{k!}.\tag{5}$

(Prova: esta fórmula satisfaz a condição inicial e a recursão .) $(3)$ $(4)$

A conexão entre os parâmetros Exponential e Poisson

Existem duas maneiras de encontrar . $p_0$ Primeiro, podemos explorar o que aprendemos anteriormente sobre tempos de espera exponenciais: é a chance de uma variável exponencial do parâmetro exceder . Isto é $p_0$ $\kappa$ $1$

\begin{matrix} (6) & p_{0 0} = e^{- κ} . \end{matrix}

$p_0 = e^{-\kappa}.\tag{6}$

O segundo é o fato de que as probabilidades somam unidade, de onde

1 1 = \sum_{k = 0 0}^{\infty} p_{0 0} \frac{λ^{k}}{k!} = p_{0 0} \sum_{k = 0 0}^{\infty} \frac{λ^{k}}{k!} = p_{0 0} e^{λ} .

$1 = \sum_{k=0}^\infty p_0\frac{\lambda^k}{k!} = p_0\sum_{k=0}^\infty \frac{\lambda^k}{k!} = p_0 e^{\lambda}.$

Portanto

\begin{matrix} (7) & p_{0 0} = e^{- λ} \end{matrix}

$p_0 = e^{-\lambda}\tag{7}$

é o valor único que funciona. Consequentemente agora é totalmente explícito: $(5)$

p_{k} = e^{- λ} \frac{λ^{k}}{k!} .

$p_k = e^{-\lambda} \frac{\lambda^k}{k!}.$

Esta é a distribuição de Poisson .

A equação e revela que $(6)$ $(7)$

κ = λ .

$\kappa = \lambda.$

Isso relaciona explicitamente o parâmetro dos tempos de espera exponenciais com o parâmetro da distribuição de Poisson.

Simulação para maior entendimento

A primeira figura não mostrou um intervalo de tempo suficientemente longo para estimar precisão o . Considere, no entanto, uma parte de outra realização de cem vezes maior: $p_k$ $N(t)$

(As linhas verticais não são mais desenhadas, porque são muito numerosas.)

Aqui estão as proporções de tempo gastas para cada . Abaixo deles estão as proporções para a distribuição de Poisson : $k$ $(2.5)$

         0      1      2      3      4      5      6      7      8     9
y   0.0745 0.2068 0.2637 0.2215 0.1290 0.0660 0.0235 0.0128 0.0016 6e-04
fit 0.0821 0.2052 0.2565 0.2138 0.1336 0.0668 0.0278 0.0099 0.0031 9e-04

O acordo é aparente - embora ainda imperfeito, porque esse ainda é apenas um pequeno segmento inicial da realização.

Aqui está o Rcódigo usado para produzir as figuras. Experimente lambdae experimente nesta análise.

lambda <- 2.5               # Poisson intensity
n <- 1000                   # Number of points to realize
x <- cumsum(rexp(n, lambda))# Accumulate the waiting times

# Compute the proportion of times for each `k` and compare to the Poisson distribution.
f <- ecdf(x)                # The ECDF does the work of computing N(t)
b <- max(x)
u <- seq(1, b, length.out=10*n)
y <- table(round(n*(f(u) - f(u-1)), 4))
y <- y / sum(y)
fit <- dpois(as.numeric(names(y)), lambda)
round(rbind(y, fit), 4)

# Plot N(t)
y.max <- max(as.numeric(names(y)))
curve(ifelse(x >= 1 & x <= b, n*(f(x) - f(x-1)), NA), 0,b, ylim=c(0, y.max*1.01),
      n=max(10001, 10*n), xlab="t", ylab="", col="#00000080",
      yaxp=c(0, y.max, y.max), bty="n", yaxt="n", yaxs="i")
rect(0, 0, b, y.max, col="#f4f4f4", border=NA)
abline(h=0:y.max, col="White")
if (n < 1000) {
  abline(v=x, lty=1, col="Gray")
  abline(v=x[x <= b-1]+1, lty=3, col="Blue")
}
curve(ifelse(x >= 1 & x <= b, n*(f(x) - f(x-1)), NA), add=TRUE,
      n=max(10001, 10*n), lwd=2, col="#802020")

— whuber
fonte

Então você não está deslizando , você está aumentando cada vez, certo? Vou aceitar a resposta, mas talvez eu tenha algumas perguntas mais tarde.

t

$t$

1

$1$

— Taylor

Você poderia fazer isso, mas na verdade estou "deslizando" no sentido de permitir que ele tenha qualquer valor real igual ou superior a . Isso aparece no tratamento teórico (integro sobre , em vez de somar sobre ele) e no código ( a função de distribuição cumulativa empírica, considera todos os valores reais de seus argumentos, não apenas valores integrais).

1

$1$

t

$t$ ecdf

— whuber

Há um comentário entre parênteses no início da seção de processo de Poisson que diz algo como "independente", que me jogou fora

— Taylor

É verdade que o número de pontos em dois intervalos sobrepostos não será independente. No entanto, essa falta de independência não afeta nenhuma análise baseada em expectativas.

— whuber

Onde posso aprender mais sobre essa abordagem de janela deslizante para examinar processos estocásticos?

— Taylor