Benjamin Doerr fornece (no capítulo "Analisando heurísticas de pesquisa randomizada: ferramentas da teoria das probabilidades" no livro "Teoria das heurísticas de pesquisa randomizada", consulte o link para um PDF on-line) uma prova bastante simples de
Proposição Seja o tempo de parada do processo de coleta de cupons. Então .TPr[T≤(1−ϵ)(n−1)lnn]≤e−nϵ
Isso parece dar os assintóticos desejados (da segunda resposta do @ cardeal), mas com a vantagem de ser verdadeiro para todos os e .nϵ
Aqui está um esboço de prova.
Esboço de prova: Seja o evento em que o ésimo cupom é coletado nos primeiros sorteios. Assim, . O fato principal é que os estão correlacionados negativamente, para qualquer , . Intuitivamente, isso é bastante claro, pois saber que o ésimo cupom nos primeiros draws tornaria menos provável que o -ésimo cupom também fosse sorteado nos primeiros draws. i t Pr [XiitPr[Xi=1]=(1−1/n)tXiI⊆[n]Pr[∀i∈I,Xi=1]≤∏i∈IPr[Xi=1]itjt
Pode-se provar a afirmação, mas ampliando o conjunto em 1 a cada etapa. Em seguida, ele reduz a mostrar que , para . Equivalentemente, calculando a média, reduz-se a mostrar que . Doerr apenas fornece um argumento intuitivo para isso. Uma avenida para uma prova é a seguinte. Pode-se observar que, condicionado ao cupom que vem depois de todos os cupons em , que a probabilidade de sacar um novo cupom de depois de sacar até agora é agora , em vez do anteriorIPr[∀i∈I,Xi=1|Xj=1]≤Pr[∀i∈I,Xi=1]j∉Ij I I k | I | - kPr[∀i∈I,Xi=1|Xj=0]≥Pr[∀i∈I,Xi=1]jIIk | I| -k|I|−kn−1 jeu|I|−kn . Assim, decompondo o tempo para coletar todos os cupons como uma soma de variáveis aleatórias geométricas, podemos ver que o condicionamento no código vindo depois que aumenta as probabilidades de sucesso e, portanto, fazer o condicionamento apenas aumenta a probabilidade de coletar os cupons mais cedo ( por dominância estocástica: cada variável aleatória geométrica é aumentada, em termos de dominância estocástica, pelo condicionamento, e essa dominância pode ser aplicada à soma).jI
Dada essa correlação negativa, segue-se que , que fornece a limite desejado com . t = ( 1 - ϵ ) ( n - 1 ) ln nPr[T≤(1−ϵ)(n−1)lnn]≤(1−(1−1/n)t)nt=(1−ϵ)(n−1)lnn