Número esperado de duplicatas (triplicatas, etc.) ao desenhar com substituição


10

Eu tenho o seguinte problema:

Tenho 100 itens exclusivos (n) e estou selecionando 43 (m) deles um de cada vez (com substituição).

Eu preciso resolver o número esperado de únicos (selecionado apenas uma vez, k = 1), duplos (selecionado exatamente duas vezes k = 2), tripples (exatamente k = 3), quads etc ...

Consegui encontrar muitos resultados sobre a probabilidade de haver pelo menos um duplo (paradoxo do aniversário), mas não sobre o número esperado de pares na população.


Uma estimativa de Monte Carlo seria útil para você ou precisa da resposta de forma fechada?
David J. Harris

Eu preferiria uma fórmula de formulário fechado para que eu possa aplicá-la facilmente a diferentes valores de n, mek.
precisa

Respostas:


7

O iterm será selecionado vezes. A partir disso, você pode encontrar todas as quantidades desejadas, porque, por exemplo, Por exemplo, o número esperado de pares é dado por ithBinom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Você pode obter o valor numérico em R com o comando n * dbinom (k, m, 1 / n).


Essa fórmula pode ser usada para ak = 0 ou 1?
precisa

Sim pode. Com k = 0, você pode interpretá-lo como `` quantos pontos não aparecerão entre os m selecionados ''.
Stefan Wager

Mas esses eventos não são independentes. Por exemplo, quando o item 1 aparece m vezes, nenhum outro item pode aparecer. Você não pode simplesmente somar os P's.
Asterix314
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.