Distribuição binomial negativa vs distribuição binomial

22

Qual é a diferença entre a distribuição binomial negativa e a distribuição binomial?

Tentei ler on-line e descobri que a distribuição binomial negativa é usada quando os pontos de dados são discretos, mas acho que até a distribuição binomial pode ser usada para pontos de dados discretos.

— aliado
fonte

5

Eles são tanto discreta.

— Glen_b -Reinstala Monica

5

Ilustração simples: você está vendendo doces de porta em porta. Em cada porta que você bate, você tem probabilidade 1/4 de vender 1 barra de chocolate e probabilidade 3/4 ou vender 0 barra de chocolate. Sua probabilidade de vender n barras se você bater em 50 portas é uma distribuição binomial em n. Sua probabilidade de ter que bater na porta m para vender 30 barras é uma distribuição binomial negativa em m. Observe que o primeiro corta aos 50 porque você não pode vender mais de 50 barras, enquanto o último tem uma cauda no infinito, porque você pode ter uma péssima sorte naquele dia e nunca vender a 30ª barra.

— Jerry Guern

30

A diferença é a que nos interessa. Ambas as distribuições são construídas a partir de ensaios independentes de Bernoulli com probabilidade fixa de sucesso, p .

Com a distribuição binomial, a variável aleatória X é o número de sucessos observados em n ensaios. Como existe um número fixo de tentativas, os possíveis valores de X são 0, 1, ..., n .

Com a distribuição Binomial Negativa, a variável aleatória Y é o número de tentativas até observar o r- ésimo sucesso. Nesse caso, continuamos aumentando o número de tentativas até alcançar r sucessos. Os possíveis valores de Y são r , r + 1 , r + 2 , ... sem limite superior. O Negative Binomial também pode ser definida em termos de número de falhas até o r th sucesso, em vez do número de ensaios até o r th sucesso. A Wikipedia define a distribuição binomial negativa dessa maneira.

Então, para resumir:

Binomial :

Número fixo de tentativas ( n )
Probabilidade fixa de sucesso ( p )
A variável aleatória é X = Número de sucessos.
Os valores possíveis são 0 ≤ X ≤ n

Binomial negativo :

Número fixo de sucessos ( r )
Probabilidade fixa de sucesso ( p )
Variável aleatória é Y = número de ensaios até o r th sucesso.
Os valores possíveis são r ≤ Y

Agradeço a Ben Bolker por me lembrar de mencionar o apoio das duas distribuições. Ele respondeu a uma pergunta relacionada aqui .

— Jelsema
fonte

4

mais discussão sobre o NB aqui: stats.stackexchange.com/questions/6728/… . Pode ser interessante notar que as respostas binomial são delimitadas [0, N], as respostas NB são ilimitada [0, ...]

— Ben Bolker

Bom ponto, atualizei minha resposta para incluir isso.

— Jelsema

graças jelsema para resposta detalhada, eu poderia entendê-lo melhor agora

— alily

19

A distribuição binomial negativa, apesar da aparente relação óbvia com o binomial, é realmente melhor comparada à distribuição de Poisson. Todos os três são discretos.

Em aplicações práticas, o NB é uma alternativa ao Poisson quando você observa a dispersão (variação) maior que o esperado por Poisson. Poisson é a primeira escolha a considerar quando você lida com dados de contagem, por exemplo, um número anual de mortes em acidentes de carro em uma cidade pequena. A média e a variância da distribuição de Poisson são definidas por um parâmetro - uma taxa de ocorrência, geralmente denotada como . Enquanto você estimar , sua média e variância seguem. De fato, a média deve ser igual à variância. $\lambda$ $\lambda$

Se seus dados sugerem que a variação é maior que a média (super-dispersão), isso exclui Poisson, o binômio negativo seria a próxima distribuição a ser observada. Ele possui mais de um parâmetro, portanto, sua variação pode ser maior que a média.

A relação do RN com o binômio vem do processo subjacente, conforme descrito na resposta de @ Jelsema. O processo está relacionado, assim como as distribuições também, mas como expliquei aqui, o link para a distribuição de Poisson é mais próximo em aplicações práticas.

UPDATE: Outro aspecto é a parametrização. A distribuição binomial possui dois parâmetros: p e n. Seu domínio de boa-fé é de 0 a n. Nisto não é apenas discreto, mas também definido em um conjunto finito de números.

Por outro lado, Poisson e NB são definidos em um conjunto infinito de números inteiros não negativos. Poisson possui um parâmetro , enquanto NB possui dois: pe er. Observe que esses dois não têm o parâmetro . Portanto, é mais uma maneira de ver como o NB e o Poisson estão conectados. $\lambda$ $n$

— Aksakal
fonte

3

Não entendo o que você quer dizer com "melhor comparado com a distribuição de Poisson". A pergunta original não diz que tipo de modelagem é desejada. Nem sequer implica que alguém esteja interessado em modelar.

— heropup

@heropup, o OP está claramente interessado em aplicativos e compara diretamente o NB ao Binomial. Portanto, minha resposta é sobre essa comparação, e essa comparação com Poisson é mais relevante em aplicações típicas.

— Aksakal

7

Ambos são discretos e representam contagens quando você está amostrando.

$D$ $N$ $S = ( DDD, DDN, DND, DNN, NDD, NDN, NND, NNN)$

$S = ( D,ND,NND,NNND,... )$

$p$

— Bahgat Nassour
fonte