Que distribuição usar para modelar o tempo antes da chegada de um trem?

15

Estou tentando modelar alguns dados sobre os horários de chegada dos trens. Eu gostaria de usar uma distribuição que capte "quanto mais eu esperar, maior a probabilidade de o trem aparecer" . Parece que essa distribuição deve se parecer com um CDF, para que P (trem apareça | esperou 60 minutos) esteja próximo de 1. Que distribuição é apropriada para usar aqui?

distributions modeling

— foobar
fonte

10

Se você esperar 25 horas e não houver trem, suspeito que a chance de um trem aparecer no próximo minuto possa ser próxima de

0

$0$ , pois é bem possível que a linha tenha sido fechada temporária ou permanentemente.

— Henry

@ Henry, isso depende inteiramente da sua crença em probabilidades anteriores. Por exemplo, a estação ferroviária menos utilizada na Grã-Bretanha, theguardian.com/uk-news/2016/dec/09/… , tem lacunas de chegadas por mais de um dia (aos domingos não há serviço).

— Sextus Empiricus

@MartijnWeterings - talvez graças aos jornalistas, Shippea Hill tenha visto um aumento de 1200% no uso e nem sequer fez o menor uso no ano seguinte , alguns dos quais, como o Aeroporto de Teesside, têm um trem por semana em uma direção

— Henry

17

Multiplicação de duas probabilidades

A probabilidade de uma primeira chegada a um tempo entre $t$ e $t+dt$ (o tempo de espera) é igual à multiplicação de

a probabilidade de chegada entre $t$ e $t+dt$ (que pode estar relacionada à taxa de chegada $s(t)$ no momento $t$ )
e a probabilidade de não chegada antes do tempo $t$ (ou não seria a primeira).

Este último termo está relacionado a:

P (n = 0, t + d t) = (1 - s (t) d t) P (n = 0, t)

$P(n=0,t+dt) = (1-s(t)dt) P(n=0,t)$

ou

\frac{\partial P (n = 0, t)}{\partial t} = - s (t) P (n = 0, t)

$\frac{\partial P(n=0,t)}{\partial t} = -s(t) P(n=0,t)$

dando:

P (n = 0, t) = e^{\int_{0}^{t} - s (t) d t}

$P(n=0,t) = e^{\int_0^t-s(t) dt}$

e distribuição de probabilidade para tempos de espera é:

f (t) = s (t) e^{\int_{0}^{t} - s (t) d t}

$f(t) = s(t)e^{\int_0^t-s(t) dt}$

Derivação da distribuição cumulativa.

Como alternativa, você pode usar a expressão para a probabilidade de menos de uma chegada, desde que o tempo seja $t$

P (n < 1 | t) = F (n = 0; t)

$P(n<1|t) = F(n=0;t)$

e a probabilidade de chegada entre o tempo $t$ e $t+dt$ é igual à derivada

f_{arrival time} (t) = - \frac{d}{d t} F (n = 0 | t)

$f_{\text{arrival time}}(t) = - \frac{d}{d t} F(n=0 \vert t)$

Essa abordagem / método é, por exemplo, útil na derivação da distribuição gama como o tempo de espera para a n-ésima chegada em um processo de Poisson. ( tempo de espera do processo de poisson segue a distribuição gama )

Dois exemplos

Você pode relacionar isso com o paradoxo da espera (por favor, explique o paradoxo da espera ).

Distribuição exponencial: Se as chegadas são aleatórias como um processo de Poisson, então $s(t) = \lambda$ é constante. A probabilidade de uma próxima chegada é independente do tempo de espera anterior sem chegada (por exemplo, se você rolar um dado justo muitas vezes sem seis, então para a próxima rolagem você não terá uma probabilidade mais alta de seis, de repente, veja a falácia do jogador ) . Você obterá a distribuição exponencial e o pdf para os tempos de espera é:
$f (t) = λ e^{- λ t}$ $f(t) = \lambda e^{-\lambda t}$
Distribuição constante: se as chegadas estão ocorrendo a uma taxa constante (como trens chegando de acordo com um horário fixo), a probabilidade de uma chegada, quando uma pessoa já está esperando há algum tempo, aumenta. Digamos que um trem deva chegar a cada $T$ minutos, então a frequência, depois de já esperar $t$ minutos, é $s(t) = 1/(T-t)$ e o pdf para o tempo de espera será:
$f (t) = \frac{e^{\int_{0}^{t} - \frac{1}{T - t} d t}}{T - t} = \frac{1}{T}$ $f(t)= \frac{e^{\int_0^t -\frac{1}{T-t} dt}}{T-t} = \frac{1}{T}$ $0$ $T$

Portanto, é este segundo caso, com "então a probabilidade de uma chegada, quando uma pessoa já está esperando há um tempo está aumentando" , que se relaciona à sua pergunta.

$s(t) dt$ por um trem para chegar em um determinado momento pode ser uma função mais complexa.

Escrito por StackExchangeStrike

— Sextus Empiricus
fonte

7

A distribuição clássica para modelar tempos de espera é a distribuição exponencial .

A distribuição exponencial ocorre naturalmente ao descrever os comprimentos dos tempos entre chegadas em um processo homogêneo de Poisson.

— S. Kolassa - Restabelecer Monica
fonte

2

Yes, but I daresay a Poisson process is not a good model for a train network.

— leftaroundabout