Atirando bolas para os compartimentos, estime um limite inferior de sua probabilidade


14

Isso não é um dever de casa, embora pareça. Qualquer referência é bem vinda. :-)

Cenário: existem bolas diferentes e caixas diferentes (ativadas de 1 a , da esquerda para a direita). Cada bola é lançada de maneira independente e uniforme em caixas. Seja o número de bolas na ésima posição. Deixe denotar o seguinte evento.n n f ( i ) i E in n nf(i)iEi

Para cada ,jikjf(k)j1

Ou seja, os primeiros caixas (mais à esquerda bins) contém menos do que bolas, para cada .jjjji

Pergunta: Estimativa , em termos de ? Quando vai ao infinito. Um limite inferior é o preferido. Não acho que exista uma fórmula facilmente calculada.i<nPr(Ei)nn

Exemplo: . Nota Pr (E_n) = 0 .limnPr(E1)=limn(n1n)n=1ePr(En)=0

Meu palpite: Acho que i<nPr(Ei)=lnn , quando n for infinito. Eu considerei os primeiros lnn itens na soma.


1
Parece um subcaso do problema de aniversário ..
Gopi

@ Gopi Não consigo me convencer de que minha pergunta é um problema restrito de aniversário. Você pode explicá-lo explicitamente? Muito obrigado. Nota: A restrição está na soma de bolas nos primeiros compartimentos, não no número de compartimentos em um compartimento específico. j
Peng Zhang

De fato, meu mal, depois de reler o artigo da Wikipedia sobre o problema do aniversário, percebi que estava considerando outro problema que foi adaptado do problema do aniversário.
Gopi

2
Algumas idéias incorretas ... Então, pense em como codificar um estado: Leia o formulário das caixas da esquerda para a direita. Se o primeiro compartimento tiver i bolas, produza uma sequência de i uns, seguida de um 0. Faça isso para todos os compartimentos da esquerda para a direita. Sua codificação parece estar interessada no maior i, de modo que essa cadeia de caracteres binária (que possui n zeros e n) seja a primeira vez que contém mais zeros. Agora, vamos dar um salto no destino e gerar 0 e 1 com igual probabilidade . (Isso pode ser um absurdo completo). Esse problema está relacionado aos números catalães e palavras dyck. E...??? 1/2
Sariel Har-Peled

4
Na sua definição, não vejo por que importa que as bolas sejam diferentes. Além disso, a interpretação da string leva em consideração o fato de que as caixas são diferentes.
Sariel Har-Peled

Respostas:


11

EDIT: (08-08-2014) Como Douglas Zare aponta nos comentários, o argumento abaixo, especificamente a 'ponte' entre as duas probabilidades, está incorreto. Não vejo uma maneira direta de corrigi-lo. Deixarei a resposta aqui, pois acredito que ainda fornece alguma intuição, mas saiba que não é verdade em geral.

Pr(Em)l=1mPr(Fl)

Essa não será uma resposta completa, mas espero que tenha conteúdo suficiente para que você ou alguém com mais conhecimento do que eu possa terminar.

Considere a probabilidade de exatamente bolas caírem nos primeiros (de ) compartimentos:l nkln

(nk)(ln)k(nln)nk

Chame a probabilidade de que menos de bolas caiam nos primeiros compartimentos :l F lllFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

A probabilidade de o evento, , ocorrer acima é menor do que se considerarmos que cada um dos eventos ocorre independentemente e todos de uma vez. Isso nos dá uma ponte entre os dois:F lElFl

Pr(Em)l=1mPr(Fl)=l=1m(k=1l1(nk)(lnk)(nln)nk)=l=1mF(l1;n,ln)

Onde é a função de distribuição cumulativa para a distribuição Binomial com . Apenas lendo algumas linhas na página da Wikipedia e observando que , podemos usar a desigualdade de Chernoff para obter:p=lF(l1;n,ln) (l-1pn)p=ln(l1pn)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

Onde é o 'ésimo número harmônico , é a constante de Euler-Mascheroni e a desigualdade para o é obtida da página vinculada do Wolfram no MathWorld. m γ H mHmmγHm

Não se preocupando com o fator , isso finalmente nos dá:e1/4m

Pr(Em)eγ/2m

Abaixo está um gráfico de log-log de uma média de 100.000 instâncias para em função de com a função também plotada para referência:m e - γ / 2n=2048meγ/2m

insira a descrição da imagem aqui

Enquanto as constantes estão desativadas, a forma da função parece estar correta.

Abaixo está um gráfico de log-log para variar com cada ponto sendo a média de 100.000 instâncias em função de :mnm

insira a descrição da imagem aqui

Por fim, chegando à pergunta original que você queria responder, pois sabemos que temos:Pr(Em)1m

i<nPr(Ei)n

E, como verificação numérica, abaixo está um gráfico de log-log da soma , versus tamanho da instância, . Cada ponto representa a média da soma de 100.000 instâncias. A função foi plotada para referência:n x 1 / 2Snx1/2

insira a descrição da imagem aqui

Embora eu não veja nenhuma conexão direta entre os dois, os truques e a forma final desse problema têm muitos pontos em comum com o Problema do Aniversário, como inicialmente adivinhado nos comentários.


4
Como você obtém ? Por exemplo, para , calculo queSe lhe disserem que o primeiro compartimento está vazio, isso torna mais ou menos provável que os dois primeiros compartimentos tenham no máximo bola? É mais provável, então é uma subestimação. n = 100 P r ( E 2 ) = 0,267946 > 0,14761 = P r ( F 1 ) P r ( F 2 ) . 1 P r ( F 1 ) P r ( F 2 )Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).1Pr(F1)Pr(F2)
Douglas Zare

@DouglasZare, verifiquei seus cálculos, você está correto. Serve-me bem por não ser mais rigoroso.
user834

15

A resposta é .Θ(n)

Primeiro, vamos calcular .En1

Vamos supor que jogamos bolas em lixeiras e observemos a probabilidade de uma caixa ter exatamente bolas nela. Essa probabilidade vem da distribuição de Poisson e, conforme vai para a probabilidade de que haja exatamente bolas em um determinado compartimento é .n k n k 1nnknk1e1k!

Agora, vamos ver uma maneira diferente de distribuir bolas em caixas. Jogamos um número de bolas em cada posição escolhida na distribuição de Poisson e condicionamos se houver um total de bolas. Afirmo que isso fornece exatamente a mesma distribuição que jogar bolas em caixas. Por quê? É fácil ver que a probabilidade de ter bolas no ésimo compartimento é proporcional a duas distribuições.n n k j j n j = 1 1nnnkjjj=1n1kj!

Então, vamos considerar uma caminhada aleatória em que, a cada passo, você passa de para com probabilidade . Eu afirmo que, se você condicionar no caso de esse passeio aleatório retornar a 0 após etapas, a probabilidade de que esse aleatório sempre fique acima de é a probabilidade que o OP deseja calcular. Por quê? Esta altura desta caminhada aleatória após passos é menos o número de bolas nos primeiros escaninhos.t + 1 - k 1tt+1kn0sss1e1k!n0sss

Se tivéssemos escolhido uma caminhada aleatória com uma probabilidade de de subir ou descer em cada etapa, este seria o problema clássico da votação , para o qual a resposta é . Essa é uma variante do problema da cédula que foi estudada (consulte este artigo ), e a resposta ainda é . Não sei se existe uma maneira fácil de calcular a constante para para este caso. 11121 Θ(112(n1)Θ(1Θ(1n)Θ(1n)

O mesmo artigo mostra que quando a caminhada aleatória é condicionada a terminar na altura , a probabilidade de sempre permanecer positiva é desde que . Esse fato nos permitirá estimar para qualquer .Θ ( k / n ) k = O ( kΘ(k/n)Essk=O(n)Ess

Vou ser um pouco acenado pelo resto da minha resposta, mas técnicas de probabilidade padrão podem ser usadas para tornar isso rigoroso.

Sabemos que, conforme vai para , essa caminhada aleatória converge para uma ponte browniana, ou seja, movimento browniano condicionado a iniciar e terminar em . Dos teoremas gerais de probabilidade, para , a caminhada aleatória está aproximadamente longe do eixo . No caso de ter altura , a probabilidade de permanecer acima de o tempo todo antes de ser . Como é provavelmente quando , temos0 ϵ n < s < ( 1 - ϵ ) n Θ ( n0ϵn<s<(1ϵ)nxt>00sΘ(t/s)tΘ(Θ(n)xt>00sΘ(t/s)ts=Θ(n)EsΘ(1/Θ(n)s=Θ(n)EsΘ(1/n).


4

[Editar 2014-08-13: Graças a um comentário de Peter Shor, alterei minha estimativa da taxa de crescimento assintótico desta série.]

Minha crença é que cresce à medida que . Não tenho prova, mas acho que tenho um argumento convincente.limni<nPr(Ei)n

Seja uma variável aleatória que fornece o número de bolas na posição . Seja seja uma variável aleatória que fornece o número total de bolas nos compartimentos a inclusive.i B i , j = j k = i B k i jBi=f(i)iBi,j=k=ijBkij

Agora você pode escrever para qualquer . Para esse fim, vamos apresentar as funções e .j < i π g iPr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

Podemos escrever em termos de :Pr(Ei)gi

Pr(Ei)=gi(1,i1,0)

Agora, fica claro na definição de quegi

Pr(Ei)=(ni)ni+1nnhi(n)

onde é um polinómio em de grau . Isso também faz algum sentido intuitivo; pelo menos bolas deverão ser colocadas em uma das caixas ( a ésima (das quais existem ).hi(n)ni1ni+1(i+1)nni

Como estamos falando apenas de quando , apenas o coeficiente de chumbo de é relevante; vamos chamar esse coeficiente de . EntãoPr(Ei)nhi(n)ai

limnPr(Ei)=aiei

Como computamos ? Bem, é aqui que vou fazer um pouco de ondulação manual. Se você elaborar os primeiros , verá que um padrão surge no cálculo desse coeficiente. Você pode escrever comoaiEi

ai=μi(1,i1,0)
onde
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

Agora, não consegui derivar um equivalente de forma fechada diretamente, mas os 20 primeiros valores de :Pr(Ei)

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

Agora, acontece que

Pr(Ei)=iii!ei=Pois(i;i)

onde é a probabilidade de que uma variável aleatória tenha valor quando é extraída de uma distribuição de Poisson com média . Assim, podemos escrever nossa soma comoPois(i;λ)Xiλ

limni=1nPr(Ei)=x=1xxx!ex

Wolfram Alpha me diz que esta série diverge . Peter Shor aponta em um comentário que a aproximação de Stirling nos permite estimar :Pr(Ei)

limnPr(Ex)=xxx!ex12πx

Deixei

ϕ(x)=12πx

Desde a

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x) está diminuindo
  • 1nϕ(x)dx comon

nossa série cresce como (veja, por exemplo, Teorema 2 ). Isso é,1nϕ(x)dx

i=1nPr(Ei)=Θ(n)

1
Wolfram Alpha está errado. Use a fórmula de Stirling . Ele diz que, . xx/(x!ex)1/2πx
quer

@PeterShor Thanks! Atualizei a conclusão graças à sua visão e agora estou de acordo com as outras duas respostas. É interessante para mim ver três abordagens bastante diferentes para esse problema.
Ruds

4

nnn12π2

n!2nnk=0n2nkk!

Oeis é impressionante
Thomas Ahle
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.