Eu sou bastante novo em estatística (um punhado de cursos Uni de nível iniciante) e estava pensando em amostragem de distribuições desconhecidas. Especificamente, se você não tem idéia da distribuição subjacente, existe alguma maneira de "garantir" que você obtenha uma amostra representativa?
Exemplo para ilustrar: digamos que você esteja tentando descobrir a distribuição global de riqueza. Para qualquer indivíduo, você pode descobrir de alguma forma a riqueza exata deles; mas você não pode "provar" cada pessoa na Terra. Então, digamos que você experimente n = 1000 pessoas aleatoriamente.
Se sua amostra não incluiu Bill Gates, você pode pensar que não existem bilionários.
Se você incluir Bill Gates, talvez pense que bilionários são mais comuns do que realmente são.
Em ambos os casos, você não pode realmente dizer quão bilionários são comuns ou raros; você pode nem ser capaz de dizer se existe algum.
Existe um melhor mecanismo de amostragem para um caso como este?
Como você informaria a priori qual procedimento de amostragem usar (e quantas amostras são necessárias)?
Parece-me que você pode ter que "provar" uma grande porcentagem da população para saber, com algo que se aproxima de uma certeza razoável, como bilionários comuns ou raros são no planeta, e que isso se deve à distribuição subjacente ser um pouco difícil trabalhar com.