Quantas vezes repetir um evento com probabilidade conhecida antes de ocorrer várias vezes


7

Se eu tenho uma probabilidade conhecida de um evento ocorrer, 1% de chance, e preciso que o evento ocorra várias vezes, 120 vezes, sobre quantas vezes eu precisaria repetir o evento antes que eu possa esperar que esse número aconteça vezes?


17
Você tem certeza de que o evento já aconteceu esse número de vezes?
Jake Westfall

A execução desse experimento 100 vezes teria uma taxa de falhas de 1 in e. Para o ponto de Jake, precisamos de mais detalhes para dar uma resposta válida.
JTP

11
Esperando um evento 120 vezes e precisando de um evento 120 vezes são widly coisas diferentes.
Mooing Duck

Em algum lugar entre 120 e infinito.
Bob Jarvis - Restabelecer Monica

Respostas:


19

Considere uma sequência de ensaios independentes com probabilidade de sucesso . Seja o número de sucessos dos ensaios. Então tem uma distribuição binomial com os parâmetros e . O valor esperado de um binômio rv é . Uma abordagem simples é definir igual a e resolver para . Como , temos que significa quenpXnXnpE(X)=np120np=0,01n(0,01)=120n=12,000 espera-se que os ensaios obtenham 120 sucessos.


Como alternativa, aqui está uma abordagem relacionada que fornece o número de tentativas necessárias para observar r=120 sucessos com alguma probabilidade γ (ie γ=0,95)

Considere uma sequência de ensaios independentes com probabilidade de sucesso p. DeixeiX ser o número de tentativas necessárias para observar rsucessos. EntãoXtem uma distribuição binomial negativa com parâmetrosr e p. No seu caso,XBinomial negativo(120,0,01)e você deseja encontrar x de tal modo que

P(Xx)=γ.

Embora a distribuição binomial negativa não tenha função quantílica de forma fechada, essa xpode ser resolvido facilmente. Por exemplo, a resposta pode ser obtido em I por tipagem: qnbinom(.95, 120, .01). A respostax=13728 indica que 13,728 ensaios são necessários para ter uma chance de 95% de observar 120 (ou mais) sucessos.


11
O primeiro método é equivalente ao segundo com γ=0,5correto?
jpmc26

@ jpmc26 fico 0,5556 para 12000. eu usei qnbinom(.5556, 120, .01)aqui: rextester.com/l/r_online_compiler
Maxter

@ jpmc26, o primeiro método dará uma resposta semelhante ao segundo com γ=0,5.. mas eles não são equivalentes. A primeira abordagem é o número esperado de tentativas (a média) e a segunda abordagem pode ser considerada como o número médio de tentativas.
knrumsey

5

Primeiro, vou assumir que os experimentos são independentes, pois você disse que provavelmente o sucesso é sempre de 1%. A palavra-chave na sua pergunta é "esperada", o que significa que procuraremos um valor médio ou esperado .

Se você estiver interessado no número de tentativas X (com probabilidade comum de sucesso p), necessário para obter r sucessos, você pode modelar isso como uma variável aleatória binomial negativa com função de massa de probabilidade:

fX(x|r,p)=(x1r1)pr(1p)xr

parax=r,r+1,...,

O valor esperado do binômio negativo é conhecido como:

E(X)=rp

No seu caso, e . Portanto, o número esperado de ensaios independentes de seu experimento (vezes) necessários para obter sucessos é simplesmente dado porp=0.01r=120120120/0,01=12,000


Nitpick: Dizer a probabilidade é sempre 1% não é o mesmo que os ensaios ser independente
DreamConspiracy

11
@DreamConspiracy, nenhuma disputa aqui. Eu estava fazendo uma inferência a partir da descrição do OP. No caso de um NB PMF com eventos independentes, seria necessariamente o caso em que a probabilidade do evento fosse constante.
StatsStudent

1

Como outros observaram, a chance de suceder tempos suficientes seguirá uma distribuição binomial negativa. É útil plotar isso, e você pode fazer isso em R com:

plot(function(x) pnbinom(x,120,0.01),120,20000)

Que dá:

Distribuição binomial negativa

Como você pode ver, ele tem uma forma sigmoidal e existem grandes áreas com praticamente nenhuma chance e quase certeza e uma rápida mudança entre as duas próximas ao valor esperado. Portanto, aumentar o número de tentativas pode ter pouco efeito ou um efeito muito grande na chance de atingir a meta, dependendo de quantas você já decidiu.

Se você dimensionar essa função pelo número de trilhas (ou seja, chance média por tentativa), poderá ver que há um valor máximo claro,

plot(function(x) pnbinom(x,120,0.01)/x,120,20000)

Chance média por tentativa

com o qual você pode se identificar:

optimise(function(x) pnbinom(x,120,0.01)/x,c(120,20000),maximum=TRUE)
$maximum
[1] 13888

$objective
[1] 6.929301e-05

-1

Como diz Knrumsey, o número de sucessos seguirá uma distribuição binomial, mas, a menos que você precise de um alto nível de precisão, 1% é um número suficientemente pequeno para que você possa usar a aproximação de uma distribuição Poisson comλ=1201%99%=1.2121


4
Como exatamente alguém "usaria" essa distribuição de Poisson para responder à pergunta?
whuber

E por que você está multiplicando 120 de 1%(em vez de dividir um pelo outro)?
Henry Henry

2
1.2 o que? ensaios?
QWR

11
Gosto da ideia de usar a distribuição Poisson e fico feliz que você tenha mencionado isso, mas sua resposta atualmente está equivocada. De locaçãoF(k,μ) ser o valor do Poisson(μ) CDF e 1 1-α a chance desejada de observar pelo menos n ocorrências, você pode formular esta pergunta como encontrar a menor n para qual F(120-1 1,nλ)α Onde λ=1 1/100 A resposta não está relacionada a um Poisson(120×1 1/100/(1 1-1 1/100))distribuição! De interesse é a conexão com a distribuição Gamma: a solução éF120-1 1-1 1(1 1-α) Onde F120-1 1 é o gama(120-1 1)CDF.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.