Esta pergunta é derivada desta sobre a "regra .632". Estou escrevendo com referência particular à resposta / notação do user603 na medida em que simplifica as coisas.
Essa resposta começa com uma amostra do tamanho com substituição, de itens distintos na coleção (chame) de N. A probabilidade de que a amostra seja diferente de um determinado elemento de N é então
Nesta resposta, todos os elementos de N têm igual chance de serem sorteados aleatoriamente.
Minha pergunta é a seguinte: suponha que, na pergunta acima, os itens a serem desenhados sejam tais que sejam distribuídos normalmente. Ou seja, subdividimos a curva normal padrão de a em (digamos) 100 subintervalos de comprimento igual. Cada um dos 100 itens em N tem uma probabilidade de ser desenhada igual à área subtendida pela curva em seu respectivo intervalo.
Meu pensamento foi o seguinte:
O raciocínio é semelhante ao da resposta vinculada, eu acho. A probabilidade de que , com um elemento de N, é na qual é a probabilidade de desenhar
A probabilidade de um elemento m específico estar na amostra S de tamanho n é
= 1 - n ∏ 1 ( 1 - F i ) .
Um cálculo parece mostrar que, à medida que o comprimento dos subintervalos diminui, a resposta converge para o mesmo número que no primeiro caso (probabilidades de todas iguais).
Isso parece contra-intuitivo (para mim) porque a construção parece incluir elementos de N que são raros, então eu esperaria um número menor que 0,632.
Além disso, se isso estiver correto, acho que teríamos
que ainda não sei como verdadeiro ou falso.
Edit: Se for verdade, provavelmente generalizaria alguns.
Obrigado por qualquer insight.