Qual é a verdadeira resposta para a pergunta do aniversário?


13

"Qual o tamanho de uma turma para ter pelo menos 50% de probabilidade de encontrar duas pessoas com o mesmo aniversário?"

Eu tenho 360 amigos no facebook e, como esperado, a distribuição de seus aniversários não é uniforme. Eu tenho um dia com 9 amigos com o mesmo aniversário. (9 meses após os grandes feriados e o dia dos namorados parecem grandes, lol ..) Portanto, considerando que alguns dias são mais prováveis ​​para um aniversário, estou assumindo que o número 23 seja superior.

Houve uma estimativa melhor para esse problema?


3
Uma amostra de 360 ​​pessoas não produz uma amostra grande para a distribuição de aniversários em 365 dias do ano ... Você certamente não pode verificar a uniformidade em uma amostra tão pequena.
Xian

Uma pessoa tem aniversário, quais são as chances de uma segunda pessoa não compartilhar o mesmo aniversário? 364/365, quais são as chances de uma terceira pessoa não compartilhar nenhum aniversário? (364/365) * (363/365). Expanda isso até ter uma probabilidade < 50%. Isso significaria as chances de que ninguém tenha o mesmo aniversário, o que, por sua vez, significaria que as chances de pelo menos dois compartilharem um aniversário seriam > 50%.
precisa saber é o seguinte

8
Devemos assumir que você tem amigos aleatórios ?
James

1
1365

Respostas:


18

Felizmente, alguém postou alguns dados de aniversário genuínos com um pouco de discussão sobre uma questão relacionada (é o uniforme da distribuição). Podemos usar isso e reamostrar para mostrar que a resposta para sua pergunta é aparentemente 23 - a mesma que a resposta teórica .

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
De fato, pode-se mostrar, através da convexidade de Schur , que, para qualquer distribuição não uniforme de aniversários, a probabilidade de uma correspondência é pelo menos tão grande quanto no caso uniforme. Este é o Exercício 13.7 de J. Michael Steele, A Classe Mestra de Cauchy-Schwarz: Uma Introdução à Arte das Desigualdades Matemáticas , Cambridge University Press, 2004, pág. 206 .
cardeal

2
@ Xi'an: De fato. Agora, se eu conhecesse alguém que fez resenhas de livros para uma revista de estatísticas de alta qualidade e alto número de leitores, sugiro que a revisem para dar maior visibilidade aos estatísticos ... mas onde encontrar essa pessoa ...
cardeal

3
(Para quem pode estar se perguntando sobre o meu comentário imediatamente anterior, ele faz referência ao fato de que @ Xi'an é o recém-nomeado revisor do livro para chance .)
cardeal

2
@ Xi'an, verificar isso e ver o que você pensa: table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE))))).
whuber

3
Provavelmente não está claro, exceto para R cognoscenti, que o código nos comentários anteriores de @ Xi'an e eu simula a situação do OP. A administração estabelece que a chance de 9 ou mais pessoas compartilharem um aniversário, dentre as 360 escolhidas aleatoriamente em uma população uniformemente distribuída, é de apenas cerca de 40 em 100.000. O valor mais provável para o número máximo de aniversários compartilhados é 5.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.