Exemplos de processos que não são Poisson?


15

Estou procurando alguns bons exemplos de situações inadequadas para modelar com uma distribuição Poisson, para me ajudar a explicar a distribuição Poisson para os alunos.

Geralmente, usa-se o número de clientes que chegam a uma loja em um intervalo de tempo como um exemplo que pode ser modelado por uma distribuição Poisson. Estou procurando um contra-exemplo em uma veia semelhante, ou seja, uma situação que possa ser considerada como um processo de contagem positiva em tempo contínuo que claramente não é Poisson.

Idealmente, a situação deve ser a mais simples e direta possível, para facilitar a compreensão e a lembrança dos alunos.


5
Esta questão é extraordinariamente ampla. A menos que o escopo seja reduzido e mais contexto seja adicionado, é muito provável que acabe fechado. Sem querer parecer desnecessariamente duro, é semelhante a perguntar: "Quais são alguns exemplos de flores que não são vermelhas?" (Cue Harry Chapin.)
cardeal

11
Ponto tomado. Me desculpe. Eu deveria ter feito isso mais específico. Eu editei para tentar torná-lo mais claro.
Nagel

11
(+1) para a pergunta e o comentário. A atualização é muito melhor. :-)
cardeal

2
Suponho que você queira dizer "determinados processos pelos quais as pessoas podem, pelo menos, ingenuamente considerar um Poisson" (por exemplo, pelo menos, um processo de contagem). Um exemplo comum ocorre no número de sinistros em apólices de seguros gerais (seguro de P&C), devido a vários fatores possíveis, mais obviamente refletidos na heterogeneidade nas taxas de sinistros - para que haja uma superposição de processos de Poisson com diferentes intensidades. Nas situações em que a distribuição das taxas de reivindicação é bem aproximada por uma distribuição gama, a distribuição das contagens de reivindicação é, por sua vez, aproximada por um binomial negativo.
Glen_b -Reinstala Monica

Respostas:


5

Número de cigarros fumados em um período de tempo: isso requer um processo de enchimento zero (por exemplo, Poisson com enchimento zero ou binômio negativo com enchimento zero), porque nem todo mundo fuma.


Obrigado! Muitos aqui mencionaram processos inflacionados com zero, mas acho que este é o exemplo mais direto e ilustrativo que foi dado: O número de cigarros fumados por uma pessoa escolhida aleatoriamente em um período de tempo.
Nagel

Há, sem dúvida, um problema com o argumento "nem todo mundo fuma cigarros", no entanto, na medida em que você poderia alegar que esse processo ainda é Poisson, apenas que o parâmetro de intensidade é específico para cada pessoa e desconhecido (os não-fumantes teriam um valor muito pequeno). intensidade) - certo? No entanto, também se pode argumentar que essa situação viola as suposições de Poisson, pois os cigarros fumados tendem a se espalhar uniformemente ao longo do dia (para fumantes regulares) ou cluster (para fumantes sociais), para que os intervalos de tempo não sejam independentes. Então esse ainda é um bom exemplo, eu acho.
Nagel

11
O número de peixes capturados em um período de tempo é, penso eu, um exemplo mais canônico para ZIP e ZINB. Argumentos semelhantes. Embora os peixes não tenham potencial para causar efeitos viciantes na taxa de consumo. (Eu sei, eu sei, exceto pelo peixe da sua mãe, porque eles são tão bons :).
Alexis18

8

Você quer dizer dados de contagem positiva? Não consolidado?

O binômio negativo é popular.

Outro bom modelo é o Poisson com 0. inflado. Esse modelo assume que algo está acontecendo ou não - e, se estiver, segue um Poisson. Eu vi um exemplo recentemente. Perguntou-se aos enfermeiros que tratavam pacientes com Aids com que frequência experimentavam comportamentos estigmatizadores de outras pessoas como resultado de seu envolvimento com pacientes com Aids. Um grande número nunca teve essas experiências, possivelmente por causa de onde trabalhavam ou moravam. Dos que o fizeram, o número de experiências estigmatizantes variou. Havia mais 0s relatados do que você esperaria de um Poisson direto, basicamente porque uma certa proporção do grupo em estudo simplesmente não estava em um ambiente que os expôs a tais comportamentos.

Uma mistura de Poisson também daria um processo pontual.


(+1) para a distribuição de Poisson inflada a zero. Uma discussão sobre este modelo pode ser encontrada aqui

11
Marque com +1 (e outras respostas) que fornecem exemplos reais das situações mencionadas na pergunta, em vez de apenas distribuições abstratas. Este exemplo do ZIP é particularmente claro.
whuber

11
Para o crédito daqueles que responderam, devo salientar que minha pergunta inicialmente era muito superficial e não se referia a situações. Concordo que o Poisson inflado a zero é um bom exemplo. No entanto, acho um pouco complicado demais para explicar aos alunos de graduação, então ainda estou perdendo exemplos de situações simples que não podem ser modeladas por uma distribuição de Poisson.
Nagel

4

Contando processos que não são Poisson? Bem, qualquer processo de espaço de amostra finito, como binomial ou uniforme discreto. Você obtém um processo de contagem de Poisson a partir da contagem de eventos com tempos intermediários independentes, que são distribuídos exponencialmente, de modo que um grande número de generalizações cai fora daquele, como os tempos intermediários distribuídos gama ou lognormal ou Weibull, ou qualquer tipo de tempo intermediário abstrato não paramétrico distribuição.


Obrigado pela sua resposta e lamento muito que minha pergunta inicialmente não tenha sido esclarecida. Eu esclareci isso agora. O que você diz sobre processos com tempos entre chegadas não exponenciais e / ou dependentes faz sentido, mas você tem exemplos de situações que terão essas propriedades, quanto mais simples, melhor?
Nagel

4
Pode apostar! Tempo entre surtos de vírus do herpes. Você tem muito mais tempo para o seu surto inicial, porque na verdade deve contrair o vírus. Seus tempos de chegada entre os surtos subsequentes são independentes um do outro, mas têm uma taxa muito mais rápida em relação ao surto de índice. Tempos entre chegadas não exponenciais são a norma. Na análise de sobrevivência, um método analítico comumente usado são os modelos de Riscos proporcionais de Cox, nos quais você retira quaisquer suposições paramétricas sobre os tempos entre chegadas.
AdamO 20/09/12

Bom exemplo! Acho que esse é outro exemplo do Poisson inflado a zero mencionado por Placidia acima?
Nagel

4

Não está claro se você deseja ou não contar processos.

Se eu interpretar a tag 'ensino' significa que você está ensinando o processo de Poisson, para ensinar sobre um processo em geral, o processo de Bernoulli é um processo aleatório fácil de explicar e visualizar e está relacionado ao processo de Poisson. O processo de Bernoulli é o analógico discreto, portanto pode ser um conceito complementar útil. É que, em vez de tempo contínuo, temos intervalos discretos de tempo.

Um exemplo pode ser um vendedor de porta em porta em que estamos contando sucessos de casas que fazem uma compra.

  • O número de sucessos nos primeiros n ensaios tem uma
    distribuição binomial B (n, p) em vez de um Poisson
  • O número de tentativas necessárias para obter r sucessos, tem uma distribuição binomial negativa NB (r, p) em vez de uma distribuição gama
  • O número de tentativas necessárias para obter um sucesso, o tempo de espera, possui uma distribuição geométrica NB (1, p), que é o analógico discreto do exponencial.

Essa é a abordagem que Bertsekas e Tsitsiklis usam em Introdução à Probabilidade , 2ª ed., Introduzindo o processo de Bernoulli antes do processo de Poisson. Em seu livro, há mais extensões ao processo de Bernoulli aplicáveis ​​ao processo de Poisson, como mesclá-las ou particioná-las, além de conjuntos de problemas com soluções.

Se você está procurando exemplos de processos aleatórios e deseja apenas lançar os nomes, existem alguns.

O processo gaussiano é significativo em aplicações. O processo de Weiner, em particular, que é um tipo de processo gaussiano, também é chamado de movimento browniano padrão e tem aplicações em finanças e física.


Obrigado pela sua resposta, e lamento muito que minha pergunta tenha sido inicialmente tão simples e pouco clara. Eu tentei esclarecer isso agora. O link de Bernoulli para Poisson é interessante, mas o que estou procurando são exemplos de situações em tempo contínuo que não são adequadas para serem modeladas por uma distribuição de Poisson, quanto mais simples, melhor.
Nagel

3

Como atuário de propriedades / acidentes, trato de exemplos da vida real de processos discretos que não são Poisson o tempo todo. Para linhas de negócios de alta gravidade e baixa frequência, a distribuição de Poisson é inadequada, pois exige uma razão de variância para média de 1. A distribuição binomial negativa, mencionada acima, é muito mais comumente usada, e as distribuições Delaporte é usado em algumas literaturas, embora com menos frequência na prática atuarial norte-americana padrão.

Por que isso é assim é uma questão mais profunda. O binômio negativo é muito melhor porque representa um processo de Poisson para o qual o parâmetro médio é ele próprio gama distribuído? Ou é porque as ocorrências de perda fracassam na independência (como os eventos de terremoto fazem sob a teoria atual de que quanto mais se espera que a Terra escorregue, mais provável é devido ao aumento da pressão), é não estacionário (os intervalos não podem ser subdivididos em sequências, cada uma das quais é estacionária, o que permitiria o uso de um Poisson não homogêneo) e, certamente, algumas linhas de negócios permitem ocorrências simultâneas (por exemplo, negligência médica com vários médicos cobertos pela apólice).


2

Outros mencionaram vários exemplos de processos pontuais que não são Poisson. Como o Poisson corresponde a tempos entre chegadas exponenciais, se você escolher qualquer distribuição de tempo entre chegadas que não seja exponencial, o processo de ponto resultante não será Poisson. AdamO apontou o Weibull. Você pode usar gama, lognormal ou beta como opções possíveis.

O Poisson tem a propriedade de que sua média é igual à sua variância. Um processo pontual com variação maior que a média é algumas vezes referido como super-disperso e, se a média for maior que a variação, é sub-disperso. Estes termos são usados ​​para relacionar o processo a um Poisson. O binomial negativo é frequentemente usado porque pode ser super-disperso ou sub-disperso, dependendo de seus parâmetros.

O Poisson tem uma variação constante. Um processo pontual que se ajusta às condições de Poisson, exceto por não ter um parâmetro de taxa constante e, consequentemente, uma média e variância variáveis ​​no tempo, é chamado de Poisson não homogêneo.

Um processo com tempos de chegada exponencial, mas que pode ter vários eventos no momento da chegada, é chamado de Poisson composto. Embora parecido com o processo de Poisson e possuindo um nome com a palavra Poisson, processos de Poisson não homogêneos e compostos são diferentes de um processo de ponto de Poisson.


Obrigado pela sua resposta, e lamento muito que minha pergunta inicialmente tenha sido tão improvisada e pouco clara. Eu tentei esclarecer isso agora. Você menciona processos com tempos entre chegadas não exponenciais e / ou dependentes, e o que você diz sobre distribuições super e sub-dispersas é muito interessante, mas você tem exemplos de situações concretas que terão essas propriedades? Quanto mais simples melhor :)
Nagel

11
Em vez de tentar dar minha própria resposta, acho que existem muitos e muitos exemplos que você pode encontrar em livros que lidam com processos de contagem. Deixe-me recomendar que você olhe o livro de Joe Hilbe sobre a regressão binomial negativa .
Michael R. Chernick

2

Outro exemplo interessante do processo de contagem não-Poisson é representado pela distribuição Poisson truncada a zero (ZTPD). O ZTPD pode ajustar dados referentes ao número de idiomas que os indivíduos podem falar em condições fisiológicas. Nesse caso, a distribuição de Poisson é mal comportada, porque o número de idiomas falados é por definição> = 1: portanto, 0 é descartado a priori.


2

Acredito que você possa pegar o processo Poisson de chegada do cliente e ajustá-lo de duas maneiras diferentes: 1) as chegadas dos clientes são medidas 24 horas por dia, mas a loja não está realmente aberta o dia todo e 2) imaginam duas lojas concorrentes com Poisson processa os horários de chegada dos clientes e observa a diferença entre as chegadas nas duas lojas. (O exemplo 2 é do meu entendimento do Springer Handbook of Engineering Statistics, Parte A Property 1.4.)


1

Você pode reconsiderar o exemplo do futebol. Parece que as taxas de pontuação para as duas equipes aumentam com o decorrer da partida e que elas mudam quando as equipes alteram suas prioridades de ataque / defesa em resposta à pontuação atual.

Ou melhor, use-o como um exemplo de como modelos simples podem ter um desempenho surpreendentemente bom, estimulando o interesse na investigação estatística de algum fenômeno e fornecendo uma referência para estudos futuros que coletam mais dados para investigar discrepâncias e propor elaborações.

Dixon & Robinson (1998), "Um modelo de processo de nascimento para partidas de futebol de associação", The Statistician , 47 , 3.


Eu tinha um palpite de que jogos de futebol não eram bastante Poisson, mas obrigado pela referência :)
Nagel

1

Como a questão está relacionada a tornar a distribuição de Poisson mais compreensível, vou tentar, já que recentemente examinei um pouco os padrões de chamada de entrada do call center (que seguem uma distribuição exponencial sem memória e com o passar do tempo).

Penso que investigar outro modelo tangencial que requer essencialmente o conhecimento de Poisson para perceber como não é um pode ser um pouco confuso, mas sou apenas eu.

Eu acho que o problema de entender Poisson é o eixo de tempo contínuo em que ele está - a cada segundo, o evento não tem mais probabilidade de ocorrer - mas quanto mais longe você for no futuro, mais certo será. acontecendo.

Realmente, acho que simplifica o entendimento se você trocar o eixo do 'tempo' por 'ensaios' ou 'eventos'.

Alguém pode me corrigir se isso estiver fora da base, pois acho que é uma explicação fácil, mas acho que você pode substituir o lançamento de uma moeda ou o lançamento de um dado por 'tempo até que um telefonema chegue' (o que eu normalmente usado para equipe Erlang C / call center).

Em vez de 'tempo até que cheguem os telefonemas' ---- você pode substituí-lo por ... 'rola até que um dado atinja seis'.

Isso segue a mesma lógica geral. A probabilidade (como qualquer jogo) é completamente independente a cada jogada (ou minuto) e não tem memória. No entanto, a probabilidade de 'não 6' diminui cada vez mais lentamente, mas certamente para 0, à medida que você aumenta o número de tentativas. É mais fácil se você vir os dois gráficos (probabilidade de fazer uma chamada com o tempo versus probabilidade de seis com as jogadas).

Não sei se isso faz sentido - foi o que me ajudou a colocar isso em termos concretos. Agora, a distribuição de poisson é uma contagem, em vez de 'tempo entre chamadas' ou 'tentativas até o número seis' - mas depende dessa probabilidade.


Percebo como você acha que isso pode ser confuso para os alunos, mas minha ideia era simplesmente facilitar a explicação de por que o número de clientes que chegam a um restaurante em um intervalo de tempo é Poisson, se eu tivesse um balcão. -exemplo de um processo simples com eventos discretos em tempo contínuo que não era Poisson.
Nagel

11
Existem muitas opções, eu acho. Um padrão óbvio seria eventos que aumentam ou diminuem em probabilidade com suas próprias ocorrências. Difícil pensar em alguns exemplos. Talvez formigas chegando na sua cozinha / piquenique. O tempo que leva para a primeira formiga chegar é provavelmente muito maior que o segundo ou o terceiro e, é claro, mais chegadas de formigas significam mais chances de chegada de formigas futuras (dado que suas trilhas / comunicação entre si). Não tenho certeza se isso contaria.
precisa

1

Número de visitas de um cliente individual ao supermercado dentro de um determinado intervalo de tempo.

Depois de chegar ao supermercado, é improvável que você retorne por um tempo, a menos que tenha cometido um erro de planejamento.

Eu acho que a distribuição Binomial Negativa poderia ser usada aqui, mas é discreta, enquanto as visitas são em tempo contínuo.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.