Número esperado de proporção de meninas versus meninos


45

Me deparei com uma pergunta no teste de aptidão para entrevistas de emprego para o pensamento crítico. É algo como isto:

A República Zorganiana tem alguns costumes muito estranhos. Os casais desejam apenas ter filhos do sexo feminino, pois somente as mulheres podem herdar a riqueza da família; portanto, se tiverem um filho do sexo masculino, continuarão tendo mais filhos até ter uma menina. Se eles têm uma menina, eles param de ter filhos. Qual é a proporção de meninas e meninos em Zorgania?

Não concordo com a resposta modelo dada pelo autor da pergunta, que é de cerca de 1: 1. A justificativa era que qualquer nascimento sempre terá 50% de chance de ser homem ou mulher.

Você pode me convencer com uma resposta matemática mais vigorosa de se é o número de meninas e B é o número de meninos no país?E[G]:E[B]G


3
Você está correto ao discordar da resposta do modelo porque a proporção M: F de nascimentos é diferente da proporção M: F de crianças. Nas sociedades humanas reais, os casais que desejam apenas ter filhos do sexo feminino provavelmente recorrerão a meios como o infanticídio ou a adoção estrangeira para se livrar de filhos do sexo masculino, resultando em uma proporção M: F menor que 1: 1.
Gabe

10
@ Gabe Não há menção ao infanticídio na questão, é um exercício matemático em oposição a uma análise arenosa de um país real onde o assassinato é lugar comum. Igualmente a relação real dos nascimentos de meninos e meninas está mais perto de 51:49 (ignorando fatores sociais)
Richard Tingle

2
Graças às respostas, agora entendo por que a proporção seria 1: 1, o que originalmente parece contra-intuitivo para mim. Uma das razões da minha descrença e confusão é que, eu sei que as aldeias da China têm os problemas opostos de uma proporção muito alta de meninos: meninas. Percebo que, realisticamente, os casais não poderão continuar a procriar indefinidamente até obterem o sexo da criança que desejam. Na China, a lei permite apenas dois filhos no máximo para pessoas que vivem em áreas rurais, portanto, nesse caso, a proporção será mais próxima de 3: 2 do que 1: 1.
Mobius Pizza

4
@MobiusPizza: Não, a proporção é de 1: 1, não importa quantos filhos você tenha! A razão pela qual a China tem uma proporção diferente é devido a fatores sociais como infanticídio, aborto seletivo por sexo e adoção estrangeira.
Gabe #

3
@newmount As simulações são boas, mas significam apenas as suposições incorporadas a elas. A exibição apenas do código, sem nenhuma explicação, dificulta as pessoas a identificar essas suposições. Na ausência de alguma justificativa e explicação, nenhuma quantidade de saída de simulação abordará a questão aqui. No que diz respeito ao "mundo real", qualquer pessoa que faça essa afirmação precisará apoiá-la com dados sobre nascimentos humanos.
whuber

Respostas:


46

Comece sem filhos

repita o passo

{

Todo casal que ainda está tendo filhos tem um filho. Metade dos casais tem homens e metade dos casais tem mulheres.

Os casais que têm mulheres deixam de ter filhos

}

Em cada etapa, você obtém um número par de homens e mulheres e o número de casais que têm filhos reduz pela metade (ou seja, aqueles que tiveram mulheres não terão filhos na próxima etapa)

Portanto, a qualquer momento, você tem um número igual de homens e mulheres e, passo a passo, o número de casais que têm filhos diminui pela metade. À medida que mais casais são criados, a mesma situação se repete e todas as outras coisas são iguais, a população conterá o mesmo número de homens e mulheres


6
Eu acho que essa é uma excelente maneira de explicar a distribuição de probabilidade sem depender de uma prova matemática rigorosa.
LBushkin

1
O que eu gosto é que isso também explica o que aconteceu com o excesso de meninas que sua intuição espera: o excesso de meninas é desejado pelos pais (eles são os pais que tentam novamente), mas esses pais (em geral) nunca criam com sucesso um excesso de meninas.
Ben Jackson

2
Você pode simplificar ainda mais dizendo "repita a etapa {alguém decide se deve ou não ter um filho}". As regras pelas quais eles decidem são completamente irrelevantes, desde que todos produzam meninos e meninas de forma independente, com a mesma probabilidade. Nem é necessário assumir um valor para essa probabilidade; você poderia apenas dizer que a frequência na população será igual à frequência no nascimento.
21714 Steve Jobs (

1
@martino Não acredito que seja esse o caso, embora não me surpreendesse se houvesse alguma matemática muito convincente nesse sentido. Acredito que esse cenário leva a uma quebra de nossa noção de proporções, porque o número esperado de filhos por família é infinito. Você deve ser cético em relação à sua resposta devido à generalidade com que as pessoas responderam à sua pergunta neste tópico.
Jlimahaverford

1
@ martino. Por diversão, acabei de executar uma simulação com esse critério de parada. 10.000 famílias tiveram um total de 160.693.469 meninos (e esse número mais 10.000 meninas), numa proporção de 0,9999377735896915. Coisas bem incríveis.
Jlimahaverford

37

Seja o número de meninos em uma família. Assim que eles têm uma menina, eles param, entãoX

X=0 0se o primeiro filho era meninaX=1se o primeiro filho era menino e o segundo era meninaX=2se os dois primeiros filhos eram meninos e o terceiro era uma meninae assim por diante...

Se é a probabilidade de uma criança ser menino e se os gêneros são independentes entre as crianças, a probabilidade de uma família ter k meninos é P ( X = k ) = p k( 1 - p ) , ou seja , a probabilidade de tendo k meninos e depois tendo uma garota. O número esperado de rapazes é E X = Σ k = 0 k p k( 1 - P ) =pk

P(X=k)=pk(1-p),
k Notando queΣ k = 0 kpk=Σ k = 0 (k+1)pk+1nós começamos Σ k = 0 kpk-Σ k = 0 k
EX=k=0 0kpk(1-p)=k=0 0kpk-k=0 0kpk+1.
k=0 0kpk=k=0 0(k+1)pk+1
em que utilizado queΣk = 0 pk=1/(1-P)quando0<p<1(versérie geométrica).
k=0 0kpk-k=0 0kpk+1=k=0 0(k+1)pk+1-k=0 0kpk+1=k=0 0pk+1=pk=0 0pk=p1-p
k=0pk=1/(1p)0<p<1

Se , temos que E X = 0,5 / 0,5 . Ou seja, a família média tem um filho. Nós já sabemos que todas as famílias têm uma menina, então a proporção vai ao longo do tempo, mesmo por ser 1 / 1 = 1 .p=1/2EX=0.5/0.51/1=1

A variável aleatória é conhecida como variável aleatória geométrica .X


4
Obviamente, isso pressupõep o mesmo para todas as famílias. Se, em vez disso, assumirmos que alguns casais têm mais probabilidade de ter filhos do que outros ( ou seja , o número deles pé maior), o resultado muda, mesmo que o valor médio de painda seja 0,5. (Ainda assim, esta é uma excelente explicação das estatísticas subjacentes básicas.)
Ben Hocking

2
@ Ben Seu comentário contém uma ideia-chave. O mesmo me ocorreu, por isso editei minha pergunta para incluir uma análise dessa situação mais realista. Isso mostra que a taxa de limitação não é necessariamente 1: 1.
whuber

1
@BenHocking Indeed! E como sabemos a partir de ambas as estatísticas modernas e análise clássico de Laplace de rácios de nascimento, não é realmente igual a 1 / 2 de qualquer maneira. :)p1/2
MånsT

21

Sumário

O modelo simples de que todos os nascimentos têm 50% de chance de ser meninas é irreal e, como se vê, excepcional. Assim que considerarmos as consequências da variação nos resultados entre a população, a resposta é que a proporção menina: menino pode ser qualquer valor que não exceda 1: 1. (Na realidade, provavelmente ainda seria próximo de 1: 1, mas isso é questão de análise de dados).

Como essas duas respostas conflitantes são obtidas ao assumir a independência estatística dos resultados do nascimento, um apelo à independência é uma explicação insuficiente. Assim, parece que a variação (nas chances de nascimentos femininos) é a ideia principal por trás do paradoxo.

Introdução

Um paradoxo ocorre quando pensamos que temos boas razões para acreditar em alguma coisa, mas somos confrontados com um argumento de aparência sólida ao contrário.

Uma solução satisfatória para um paradoxo nos ajuda a entender o que estava certo e o que pode estar errado sobre os dois argumentos. Como costuma ser o caso em probabilidade e estatística, ambos os argumentos podem realmente ser válidos: a resolução depende de diferenças entre suposições implicitamente feitas. Comparar essas diferentes suposições pode nos ajudar a identificar quais aspectos da situação levam a respostas diferentes. Identificar esses aspectos, sustento, é o que mais devemos valorizar.

Premissas

Como evidenciado por todas as respostas postadas até agora, é natural supor que nascimentos femininos ocorrer de forma independente e com probabilidades constantes de . É sabido que nenhuma dessas suposições é realmente verdadeira, mas parece que pequenos desvios dessas suposições não devem afetar muito a resposta. Deixe-nos ver. Para esse fim, considere o seguinte modelo mais geral e mais realista:1/2

  1. Em cada família a probabilidade de um nascimento feminina é uma constante p i , independentemente da ordem de nascimento.ipi

  2. Na ausência de qualquer regra de parada, o número esperado de partos femininos na população deve estar próximo ao número esperado de partos masculinos.

  3. Todos os resultados do nascimento são (estatisticamente) independentes.

Isso ainda não é um modelo totalmente realista de nascimentos humanos, em que o podem variar com a idade dos pais (particularmente a mãe). No entanto, é suficientemente realista e flexível para fornecer uma resolução satisfatória do paradoxo que se aplicará ainda a modelos mais gerais.pi

Análise

Embora seja interessante realizar uma análise completa desse modelo, os principais pontos se tornam aparentes mesmo quando uma versão específica, simples (mas um tanto extremada) é considerada. Suponha que a população tenha famílias N. Em metade destes a chance de um nascimento feminino é de 2 / 3 e na outra metade a chance de um nascimento feminino é de 1 / 3 . Isso claramente satisfaz a condição (2): o número esperado de partos femininos e masculinos é o mesmo.2N2/31/3

Considere essas primeiras famílias. Vamos raciocinar em termos de expectativas, entendendo que os resultados reais serão aleatórios e, portanto, variarão um pouco das expectativas. (A idéia por trás da análise a seguir foi transmitida de forma mais breve e simples na resposta original que aparece no final deste post.)N

f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • pN(1p)NpN(1p)N

  • (1p)Nf(p)[(1p)N]m(p)[(1p)N]

f(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

com soluções

f(p)=1  e  m(p)=1p-1

Np=2/3f(2/3)N=Nm(2/3)N=N/2

Np=1/3f(1/3)N=Nm(1/3)N=2N

(1+1)N=2N(1/2+2)N=(5/2)NN

E(# meninas# Rapazes)2N(5/2)N=45.

A regra de parada favorece os meninos!

p1-pN

2p(1-p)1-2p(1-p).

p0 010 0111p=1/2

Resolução

Se sua intuição é que parar com a primeira garota deve produzir mais meninos na população, então você está correto, como mostra este exemplo. Para estar correto, tudo o que você precisa é que a probabilidade de dar à luz uma menina varie (mesmo que apenas um pouco) entre as famílias.

A resposta "oficial", de que a proporção deve ser próxima de 1: 1, requer várias suposições irrealistas e é sensível a elas: supõe que não pode haver variação entre as famílias e que todos os nascimentos devem ser independentes.

Comentários

A idéia principal destacada por esta análise é que a variação dentro da população tem consequências importantes. A independência de nascimentos - embora seja uma suposição simplificadora usada para todas as análises neste tópico - não resolve o paradoxo, porque (dependendo das outras suposições) é consistente tanto com a resposta oficial quanto com o seu oposto.

pEupEupEu

Se substituirmos o gênero por alguma outra expressão genética, obteremos uma explicação estatística simples da seleção natural : uma regra que limita diferencialmente o número de filhos com base em sua composição genética pode alterar sistematicamente as proporções desses genes na próxima geração. Quando o gene não está ligado ao sexo, mesmo um pequeno efeito será propagado multiplicativamente por gerações sucessivas e pode rapidamente se tornar bastante ampliado.


Resposta original

Cada criança tem uma ordem de nascimento: primogênito, segundo e assim por diante.

Assumindo probabilidades iguais de nascimentos masculinos e femininos e sem correlações entre os sexos, a Lei Fraca dos Grandes Números afirma que haverá uma proporção próxima de 1: 1 entre mulheres primogênitas e homens. Pela mesma razão, haverá uma proporção próxima de 1: 1 de fêmeas nascidas para homens e assim por diante. Como essas proporções são constantemente de 1: 1, a proporção geral também deve ser de 1: 1, independentemente da frequência relativa das ordens de nascimento na população.


Interessante; isso parece ser porque, embora nenhuma regra possa alterar a proporção da proporção natural, ela pode alterar o número de filhos resultantes e esse número de filhos depende da proporção natural. Portanto, no seu exemplo, você tem duas populações de pais e elas são afetadas de maneira diferente. (Que diziam que este este se sente como uma situação fora do âmbito do país fictício implícita que é mais de um exercício matemático)
Richard Tingle

pEu1/21

1
nem você deve se desculpar, este é um resultado muito interessante (na verdade, acho que uau quando o li). Eu preferiria apenas na forma "Resultado original", "Situação mais realista". Do jeito que está escrito, parece trapaça (o que é injusto, porque, como eu digo, é muito interessante) porque eu poderia dizer com a mesma facilidade "Bem, obviamente, não é 1: 1, porque os nascimentos masculinos são mais comuns" (acredito devido a nossas locações históricas morrer em conflito armado)
Richard Tingle 17/04

pEu0,51

@whuber Obrigado pela resposta informativa. Não entendo por que, no seu cálculo, você divide a população em duas famílias com probabilidade diferente de dar à luz meninas. De acordo com o ponto 1 da suposição do modelo, o p_i deve ser o mesmo para todas as famílias. Então, por que você dividiu a população em dois tipos de famílias?
Mobius Pizza

14

O nascimento de cada criança é um evento independente com P = 0,5 para um menino e P = 0,5 para uma menina. Os outros detalhes (como as decisões da família) apenas o distraem desse fato. A resposta, então, é que a proporção é 1: 1 .

Para explicar isso: imagine que, em vez de ter filhos, você esteja jogando uma moeda justa (P (cara) = 0,5) até obter uma "cara". Digamos que a família A vira a moeda e obtém a sequência de [caudas, caudas, cabeças]. Então a família B lança a moeda e recebe uma coroa. Agora, qual é a probabilidade de o próximo ser cara? Ainda 0,5 , porque é isso que independente significa. Se você fizesse isso com 1000 famílias (o que significa que 1000 caras apareceram), o número total esperado de caudas é 1000, porque cada flip (evento) era completamente independente.

Algumas coisas não são independentes, como a sequência dentro de uma família: a probabilidade da sequência [cabeças, cabeças] é 0, não é igual a [caudas, caudas] (0,25). Mas como a pergunta não está perguntando sobre isso, é irrelevante.


3
Como afirmado, isso está incorreto. Se os gêneros fossem incondicionalmente independentes, a longo prazo haveria tantas seqüências de meninas entre meninas entre as famílias quanto seqüências de meninos e meninos. Existem muitos dos últimos e nunca nenhum dos primeiros. Há uma forma de independência, mas é condicional sobre a ordem de nascimento.
whuber

1
@whuber Não nos perguntam quantas seqüências de meninas e meninas existem. Apenas a proporção de meninas para meninos. Não afirmei que a sequência de nascimentos de uma mãe individualmente seja uma série de eventos independentes, como lançamentos de moedas. Só que cada nascimento, individualmente, é um evento independente.
Tim S.

Você precisará ser muito mais claro sobre isso. Mencionei as seqüências para demonstrar a falta de independência; portanto, cabe a você indicar exatamente em que sentido rigoroso "independência" se aplica aqui.
whuber

@whuber Os eventos são independentes da mesma forma que os lançamentos de moedas. Eu expus sobre isso na minha resposta.
Tim S.

3
@whuber as seqüências garota-garota aparecem se você colocar todos os nascimentos em uma linha; depois de um casal finishs o próximo movimento na etc etc
Richard Tingle

6

Imagine jogar uma moeda justa até observar uma cabeça. Quantas caudas você joga?

P(0 0 caudas)=12,P(1 rabo)=(12)2,P(2 caudas)=(12)3,...

O número esperado de caudas é facilmente calculado * para 1.

O número de cabeças é sempre 1.

* se isso não estiver claro para você, consulte 'resumo da prova' aqui


6

Casais com exatamente uma garota e nenhum garoto são os mais comuns

A razão de tudo dar certo é que a probabilidade de um cenário em que há mais meninas é muito maior do que os cenários em que há mais meninos. E os cenários em que há muito mais meninos têm probabilidades muito baixas. A maneira específica como funciona é ilustrada abaixo

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

Você pode ver até onde isso está indo, neste momento, o total de meninas e meninos vai somar um.

Garotas esperadas de um casal=n=1(12n)=1
=n=1(n-1n2)=1

Soluções de limite da wolfram

Qualquer nascimento, qualquer que seja a família, tem 50:50 de chance de ser menino ou menina

Tudo isso faz sentido intrínseco, porque (por mais que tentem os casais), você não pode controlar a probabilidade de um nascimento específico ser menino ou menina. Não importa se uma criança nasce com um casal sem filhos ou uma família de cem meninos; a chance é de 50:50, portanto, se cada nascimento individual tiver uma chance de 50:50, você sempre deve ter meio menino e meia menina. E não importa como você embaralha os nascimentos entre famílias; você não vai afetar isso.

Isso funciona para qualquer 1 regra

Devido à chance de 50:50 de qualquer nascimento, a proporção terminará em 1: 1 para qualquer regra (razoável 1 ) que você possa criar. Por exemplo, a regra semelhante abaixo também funciona mesmo

Casais deixam de ter filhos quando têm uma menina ou têm dois filhos

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

Nesse caso, o total esperado de filhos é calculado com mais facilidade

Garotas esperadas de um casal=0,51+0,251=0,75
=0,251+0,252=0,75

1 Como eu disse, isso funciona para qualquer regra razoável que possa existir no mundo real. Uma regra irracional seria aquela em que os filhos esperados por casal fossem infinitos. Por exemplo, "Os pais só param de ter filhos quando têm o dobro de meninos do que meninas", podemos usar as mesmas técnicas acima para mostrar que esta regra gera infinitos filhos:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

Podemos então encontrar o número de pais com um número finito de filhos

Número esperado de pais com filhos finitos=m=1(11/(3m)2)=π254=0,18277....

Soluções de limite da wolfram

Assim, podemos estabelecer que 82% dos pais teriam um número infinito de filhos; do ponto de vista do planejamento urbano, isso provavelmente causaria dificuldades e mostra que essa condição não poderia existir no mundo real.


3
O fato de os nascimentos não serem independentes é evidente ao examinar as seqüências de nascimentos: a sequência menina-menina nunca aparece enquanto as seqüências menino-menino ocorrem com frequência.
whuber

1
@whuber Entendo o seu ponto de vista (embora, sem dúvida, seja a decisão de ter um filho que seja dependente, e não o resultado do evento), seria melhor dizer "a probabilidade de um futuro nascimento de ser menino é independente de todos os nascimentos passados"
Richard Tingle

Sim, acho que há uma maneira de resgatar o uso da independência aqui. Mas acho que isso chega ao cerne da questão, e parece que, para honrar o pedido do OP de uma demonstração "vigorosa" (rigorosa?), É necessário algum raciocínio cuidadoso sobre esse assunto.
whuber

@whuber Para ser honesto que o primeiro parágrafo é o bit handwavey, os novos parágrafos (e especificamente os limites) são suposto ser o pouco rigorosa
Richard Tingle

Não há argumento - mas o último material já foi abordado da mesma maneira nas respostas em stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835 e stats.stackexchange.com/a/93841 .
whuber

5

Você também pode usar a simulação:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio

1
Os resultados da simulação são bons, pois podem nos dar algum conforto que não cometemos um erro grave em uma derivação matemática, mas estão longe da rigorosa demonstração solicitada. Em particular, quando eventos raros que contribuem muito para uma expectativa podem ocorrer (como uma família com 20 meninos antes que uma menina apareça - o que é altamente improvável que surja em uma simulação de apenas 10.000 famílias), as simulações podem ser instáveis ​​ou mesmo errado, não importa quanto tempo eles sejam iterados.
whuber

Reconhecer a distribuição geométrica de # meninos na família é o passo chave para esse problema. Tente:mean(rgeom(10000, 0.5))
AdamO 15/04

5

Mapear isso me ajudou a ver melhor como a proporção da população de nascimentos (assumida como 1: 1) e a proporção da população de crianças seria de 1: 1. Embora algumas famílias tenham vários meninos, mas apenas uma menina, o que inicialmente me levou a pensar que haveria mais meninos do que meninas, o número dessas famílias não seria superior a 50% e diminuiria pela metade com cada criança adicional, enquanto o o número de famílias com apenas uma menina seria de 50%. O número de meninos e meninas se equilibraria. Veja o total de 175 na parte inferior. Proporção de crianças


2

O que você conseguiu foi a resposta mais simples e correta. Se a probabilidade de um filho recém-nascido ser menino é p, e os filhos do sexo errado não são atingidos por acidentes infelizes, não importa se os pais tomam decisões sobre ter mais filhos com base no sexo do filho. Se o número de filhos for N e N for grande, você pode esperar cerca de p * N meninos. Não há necessidade de um cálculo mais complicado.

Certamente existem outras questões, como "qual é a probabilidade de o filho mais novo de uma família ter filhos" ou "qual é a probabilidade de que o filho mais velho de uma família com filhos seja um menino". (Um deles tem uma resposta correta simples, o outro tem uma resposta errada simples e é complicado obter uma resposta correta).


2

Deixei

Ω= {(G), (B, G), (B, B, G),...}

seja o espaço da amostra e deixe

X: ΩRω|ω|-1

ωEX)

E (X) =n=1(n-1)0,5n= 1

Trivialmente, o valor esperado das meninas é 1. Portanto, a proporção também é 1.


2

É uma pergunta complicada. A proporção permanece a mesma (1: 1). A resposta certa é que ela não afeta a proporção de nascimentos, mas afeta o número de filhos por família, com um fator limitante de uma média de 2 nascimentos por família.

Esse é o tipo de pergunta que você pode encontrar em um teste de lógica. A resposta não é sobre a proporção de nascimentos. Isso é uma distração.

Esta não é uma questão de probabilidade, mas uma questão de raciocínio cognitivo. Mesmo se você respondeu a proporção de 1: 1, ainda falhou no teste.


Recentemente, editei minha resposta para mostrar que a solução não é necessariamente 1: 1, o que contraria explicitamente suas afirmações.
whuber

Eu li sua resposta. Você introduziu um predicado que não está indicado no problema (variação na taxa de natalidade das fêmeas). Não há nada no problema que afirme que a República Zorganiana seja representativa da população humana ou mesmo de seres humanos.
Andrew - OpenGeoCode

1
Isso está correto - mas também não há nada que justifique a suposição simplificada de que todas as probabilidades de nascimento são iguais. É necessário fazer suposições para fornecer uma resposta objetiva e defensável, para que, no mínimo, uma boa resposta seja explícita sobre as suposições feitas e forneça suporte para essas suposições. Afirmar que "essa não é uma questão de probabilidade" não trata dos problemas, mas os ignora completamente.
whuber

@ whuber - A proporção de nascimentos neste problema é invariável. A variante do problema é o número de nascimentos por família. A questão é uma distração, não faz parte do problema. <br/> O pensamento lateral é a capacidade de pensar criativamente, ou "fora da caixa", como às vezes é referido nos negócios, de usar sua inspiração e imaginação para resolver problemas, olhando-os de perspectivas inesperadas. O pensamento lateral envolve descartar o óbvio, deixar para trás os modos tradicionais de pensamento e jogar fora os preconceitos. [fyi> Sou o principal cientista do laboratório]
Andrew - OpenGeoCode 16/04

1
Você pode, então, ter esquecido um ponto-chave da minha resposta: suas suposições também mantêm a chance média da população de um parto feminino invariável em 1: 1 (de uma maneira específica que, espero, esteja claramente descrita). Eu sustentaria que existe um "pensamento lateral" substancial envolvido em qualquer resolução de um paradoxo no qual as suposições são examinadas criticamente: requer imaginação e boas habilidades analíticas para ver se alguém está fazendo suposições em primeiro lugar. Descartar qualquer questão diretamente como um mero "truque", como você faz aqui, pareceria antiético para promover ou celebrar esse pensamento.
whuber

2

Estou mostrando o código que escrevi para uma simulação de Monte Carlo (famílias 500x1000) usando o software `MATLAB '. Examine o código para não cometer nenhum erro.

O resultado é gerado e plotado abaixo. Ele mostra que a probabilidade simulada de nascimento de uma menina tem uma concordância muito boa com a probabilidade de nascimento natural subjacente, independentemente da regra de parada para uma gama de probabilidade de nascimento natural.

insira a descrição da imagem aqui

Brincando com o código, é mais fácil entender um ponto que eu não entendi antes - como outros apontam, a regra de parar é uma distração. A regra de parada afeta apenas o número de famílias que recebem uma população fixa ou, de outro ponto de vista, o número de nascimentos de crianças que recebem um número fixo de famílias. O sexo é determinado exclusivamente pelo lançamento de dados e, portanto, a proporção ou probabilidade (que é independente do número de filhos) dependerá apenas do menino natural: menina nascimento rato.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])

2

EuthXEu0,5

E[EuXEu]=EuE[XEu]=0,5nn

E[Eu(1-XEu)]=EuE[1-XEu]=0,5n

A independência dos nascimentos é irrelevante para o cálculo dos valores esperados.


Em relação à resposta do whuber, se houver uma variação da probabilidade marginal entre as famílias, a proporção fica distorcida em relação aos meninos, devido ao fato de haver mais filhos em famílias com maior probabilidade de meninos do que famílias com menor probabilidade, tendo assim um efeito aumentador de a soma do valor esperado para os meninos.


2

Independentemente, também programei uma simulação no matlab, antes de ver o que os outros fizeram. A rigor, não é um MC, porque eu só faço o experimento uma vez. Mas uma vez é suficiente para obter resultados. Aqui está o que minha simulação produz. Não defendo a probabilidade de nascimentos serem p = 0,5 como primitivos. Deixo a probabilidade de nascimento variar em um intervalo de Pr (meninos = 1) = 0,25: 0,05: 0,75.

Meus resultados mostram que, como a probabilidade se desvia de p = 0,5, a razão sexual é diferente de 1: na expectativa, a razão sexual é simplesmente a razão entre a probabilidade de nascimento de um menino e a probabilidade de nascimento de uma menina. Ou seja, essa é uma variável aleatória geométrica conforme identificado anteriormente por @ månst. Isso é o que eu acredito que o pôster original foi uma intuição.

Meus resultados imitam o que o pôster acima com o código matlab fez, correspondendo às proporções de sexo nas probabilidades de 0,45, 0,50 e 0,55 de nascimento de um menino. Apresento o meu, adotando uma abordagem um pouco diferente para obter os resultados com um código mais rápido. Para realizar a comparação, omiti a seção de código vec = vec (randperm (s, N)), pois s não está definido em seu código e não conheço a intenção original dessa variável (essa seção de código também parece supérflua - como originalmente indicado).

Eu posto meu código

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

O gráfico a seguir é esperado, dada a forte lei do grande número. Eu o reproduzo, mas o gráfico que importa é o segundo gráfico.

insira a descrição da imagem aqui

Aqui, uma probabilidade populacional diferente de 0,5 para o nascimento de qualquer sexo de uma criança alterará a proporção de sexo na população geral. Supondo que os nascimentos sejam independentes (mas não a opção de continuar reproduzindo), em cada rodada de reprodução condicional, a probabilidade da população governa a composição geral dos resultados dos nascimentos de meninos e meninas. Assim, como outros já mencionaram, a regra de parada no problema é irrelevante para o resultado da população, conforme respondido pelo pôster que identificou isso como a distribuição geométrica.

insira a descrição da imagem aqui

Para completar, o que a regra de parada afeta é o número de rodadas de reprodução na população. Como eu só executei o experimento uma vez, o gráfico está um pouco irregular. Mas a intuição está lá: para um determinado tamanho da população, à medida que a probabilidade de nascimento de uma menina aumenta, vemos que as famílias precisam de menos rondas de reprodução para obter a garota desejada antes que toda a população pare de se reproduzir (obviamente o número de rondas dependerá do número de rondas). tamanho da população, uma vez que aumenta mecanicamente a probabilidade de uma família ter, por exemplo, 49 meninos antes de ter a primeira filha)

insira a descrição da imagem aqui

A comparação entre minhas relações sexuais calculadas:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

e aqueles do pôster anterior com o código matlab:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

São resultados equivalentes.


1

Depende do número de famílias.

Xp=0,5

P(X=x)=0,5x,x=1,2,3 ...
E(X)=2

N

NXEu

XEu/NE(X)=2N

TT=XEuT

P(T=t)=CN-1t-10,5t,t=N,N+1 ...

E[NXEu]=E[NT]=t=NNtCN-1t-10,5t=2F1(N,1,N+1,-1)
2F1

Portanto, a proporção esperada de meninas é 2F1(N,1,N+1,-1)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.