Observe que, em cada posição de observação ( ), podemos escolher qualquer uma das observações; portanto, existem possíveis novas amostras (mantendo a ordem em que são desenhadas) das quaissão a "mesma amostra" (ou seja, contêm todas as observações originais sem repetições; isso explica todas as maneiras de solicitar a amostra com a qual começamos).n n n n ! ni=1,2,...,nnnnn!n
Por exemplo, com três observações, a, bec, você tem 27 amostras possíveis:
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
Seis deles contêm um de a, bec.
Portanto, é a probabilidade de recuperar a amostra original.n!/nn
Além - uma rápida aproximação da probabilidade:
Considere o seguinte :
2π−−√ nn+12e−n≤n!≤e nn+12e−n
tão
2π−−√ n12e−n≤n!/nn≤e n12e−n
Com o limite inferior sendo o usual dado para a aproximação de Stirling (que possui um erro relativo baixo para grande ).n
[Gosper sugeriu o uso de que produziria a aproximação para esta probabilidade , que funciona razoavelmente bem até ou até dependendo de quão rigorosos são seus critérios.]n!≈(2n+13)π−−−−−−−−−√nne−n(2n+13)π−−−−−−−−√e−nn=3n=1
(Resposta ao comentário :) A probabilidade de não obter uma observação específica em uma determinada amostra é que para grande é aproximadamente .nE-1(1−1n)nne−1
Para obter detalhes, consulte
Por que, em média, cada amostra de inicialização contém aproximadamente dois terços das observações?