Análise de bolas e caixas no regime m >> n.


17

É sabido que, se você jogar n bolas em n compartimentos, é altamente provável que a bandeja mais carregada tenha . Em geral, pode-se perguntar sobre bolas em caixas. Um artigo da RANDOM 1998 de Raab e Steger explora isso com alguns detalhes, mostrando que à medida que aumenta, a probabilidade de ir um pouco acima do valor esperado de diminui rapidamente. Aproximadamente, definindo , eles mostram que a probabilidade de ver mais de é .O(logn)m>nm m / n r = m / n r + nmm/nr=m/nr+rlogno(1)

Este artigo foi publicado em 1998 e não encontrei nada mais recente. Existem resultados novos e ainda mais concentrados nesse sentido, ou existem razões heurísticas / formais para suspeitar que esse é o melhor possível? Devo acrescentar que um artigo relacionado sobre a variante de múltipla escolha, em co-autoria de Angelika Steger em 2006, também não cita nenhum trabalho mais recente.

Atualização : em resposta ao comentário de Peter, deixe-me esclarecer as coisas que gostaria de saber. Eu tenho dois objetivos aqui.

  1. Primeiro, preciso saber qual referência citar, e parece que esse é o trabalho mais recente sobre isso.
  2. Em segundo lugar, é verdade que o resultado é bastante apertado na faixa r = 1. Estou interessado no intervalo m >> n e, especificamente, no domínio em que r pode ser poly log n, ou até n ^ c. Estou tentando inserir esse resultado em um lema que estou provando, e o limite específico em r controla outras partes do algoritmo geral. Eu acho (mas não tenho certeza) que o intervalo em r fornecido por este artigo pode ser suficiente, mas eu só queria ter certeza de que não havia um limite mais restrito (que produziria um resultado melhor).

3
Aprendi o nome “problema de ocupação” com a tag, então obrigado por postar uma pergunta educacional. :)
Tsuyoshi Ito

7
Olhando para o artigo de Raab e Steger, é difícil para mim descobrir quais resultados adicionais você deseja nesse sentido. Existe uma pergunta específica para a qual você precise saber a resposta? Nesse caso, você deve perguntar, aqui ou no MathOverflow. Em particular, se r=m/n , Raab e Steger fornecem um limite estreito de que2é a constante correta. r+2rlogn2
Peter Shor

@ Peter Vou editar a pergunta: é um ponto válido.
Suresh Venkat

Respostas:


8

Não é realmente uma resposta completa (nem uma referência útil), mas apenas um comentário bastante extenso. Para qualquer posição, a probabilidade de ter exatamente bolas na posição será dada por . Podemos usar uma desigualdade devido a Sondow, , para produzir , em que . Observe que esse limite é bastante restrito, pois a .B((b+1)apB=(mB)(1 1n)B(n-1 1n)m-BpB<((r+1)r+1((b+1 1)umauma)<((b+1 1)b+1 1bb)umar=mpB<((r+1 1)r+1 1rr)B(1 1n)B(n-1 1n)m-B ( (b+1)ar=mB-1 1((b+1 1)umauma)>1 14umab((b+1 1)b+1 1bb)uma

Portanto, temos . Agora, como você está interessado na probabilidade de encontrar ou mais bolas em uma lixeira, podemos considerar . Reorganizando os termos, obtemos B p B = m b = B p b < Σ m b = b e b ( r + 1pB<eB(r+1 1)em(r+1 1)-Bremr-memn+(m-B)em(n-1 1)B p B < e - m ln npB=b=Bmpb<b=Bmeb(r+1 1)em(r+1 1)-bremr-memn+(m-b)em(n-1 1)

pB<e-memnn-1 1×eB(r+1 1)em(r+1 1)-Bremr-Bem(n-1 1)b=0 0m-Beb(r+1 1)em(r+1 1)-bremr-bem(n-1 1).

Observe que o somatório acima é apenas uma série geométrica; portanto, podemos simplificá-lo para fornecerSe reescrevermos termos usando exponenciais, obteremos que então se torna(r+1)r+1

pB<e-memnn-1 1×eB(r+1 1)em(r+1 1)-Bremr-Bem(n-1 1)×1 1-((r+1 1)r+1 1rr(n-1 1))m-B+1 11 1-((r+1 1)r+1 1rr(n-1 1)).
pB<e-mlnn(r+1 1)r+1 1rr(n-1 1)
pB<e-memnn-1 1×eB(r+1 1)em(r+1 1)-Bremr-Bem(n-1 1)×1 1-(e(r+1 1)em(r+1 1)-remr-em(n-1 1))m-B+1 11 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1),
pB<e-memnn-1 1×(eB((r+1 1)em(r+1 1)-remr-em(n-1 1))-e(m+1 1)((r+1 1)em(r+1 1)-remr-em(n-1 1)))1 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1).

Agora, suponho que você se preocupe em encontrar alguns tais que para algum constante , pois isso fornece a probabilidade total de qualquer caixa com ou mais bolas limitadas por acima por . Este critério é atendido considerando que pode ser reescrito comoBpB<CnCBC

e-memnn-1 1×(eB((r+1 1)em(r+1 1)-remr-em(n-1 1))-e(m+1 1)((r+1 1)em(r+1 1)-remr-em(n-1 1)))1 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1)=Cn,
B=em(Cnememnn-1 1(1 1-e(r+1 1)em(r+1 1)-remr-em(n-1 1))+e(m+1 1)((r+1 1)em(r+1 1)-remr-em(n-1 1)))(r+1 1)em(r+1 1)-remr-em(n-1 1).

Não tenho certeza de quão útil esse comentário será útil para você (é perfeitamente possível que cometi um erro em algum lugar), mas espero que possa ser útil.


11
isso é incrível. obrigado pelo esboço.
Suresh Venkat

@ Suresh: Ainda bem que é útil.
Joe Fitzsimons
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.