Importa como você experimenta uma população?


9

Eu tenho um tanque bem misturado que contém um número infinito de bolas de gude. Há uma quantidade infinita de bolas de gude no tanque, mas elas só vêm em um número desconhecido, mas finito de variedades : é desconhecido e, para , desenhar um mármore do tipo pode ser mais provável do que desenhar um mármore do tipo .

V={v1,v2,v3,...,vk}
kijvivj

Em um experimento, uma máquina coleta amostras do tanque usando algum procedimento desconhecido. A máquina reporta um conjunto descrevendo variedades de bolinhas de gude de sua amostra: Xqk

XV;|X|=q

As tentativas deste experimento são repetidas ( é corrigido entre as tentativas) e obtemos uma sequência de subconjuntos de , .qV(X1 1,X2,)

As únicas outras coisas que sabemos são:

  • ensaios são independentes e idênticos
  • a máquina relata as principais variedades mais frequentes em sua amostraq

Não sabemos exatamente como a máquina coleta amostras de mármore. Poderia escolher um grande número de bolinhas de gude e relatar o mais frequente. Como alternativa, ele pode continuar pegando bolinhas de gude até que haja q variedades. Há outras coisas que ele também poderia fazer.qq

A distribuição de nossos testes será afetada pelo procedimento de amostragem da máquina?(X1 1,X2,)


3
+1 Esta é uma ótima pergunta, pois considera que há mais na amostragem aleatória do que alguma forma vaga de arbitrariedade ou falta de conhecimento sobre o procedimento de amostragem.
whuber

A regra de amostragem certamente será importante. Caso contrário, considere este procedimento: a máquina, a cada tentativa, sempre seleciona uma única bola de gude do tipo 1 (primeira variedade). Cada sorteio será independente e terá distribuição idêntica (trivialmente), e você obterá q = 1, um resultado perfeitamente inútil.
AlaskaRon

Respostas:


9

Uma maneira simples de verificar se o método é importante é escolher probabilidades específicas para tipos de bolinhas de gude e calcular a chance de cada subconjunto de acordo com alguns métodos. Isso não pode provar que o método não importa, no entanto.

Suponhamos que existem tipos e as possibilidades de cada tipo são 1 / 2 , 1 / 4 , e 1 / 4 , respectivamente. Suponha que você esteja escolhendo 2 tipos de bolinhas de gude.31 1/21 1/41 1/42

{v2,v3}21 1/41 1/3=1 1/6

{v2,v3}

21 1/41 1/421 1/41 1/4+21 1/21 1/4+21 1/21 1/4=1 1/81 1/8+1 1/4+1 1/4=1 1/5)

Como são diferentes, o método usado pela máquina é importante. Rejeitar pares com tipos repetidos tende a ponderar menos os pares com tipos comuns.

q

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.