Probabilidade de nascer em um dia bissexto?


31

Dado que hoje é um dia bissexto, alguém sabe a probabilidade de nascer em um dia bissexto?


30
Observe que os nascimentos não são distribuídos uniformemente ao longo do ano; portanto, a probabilidade de um dia escolhido aleatoriamente ser um dia bissexto não é a mesma que a probabilidade de nascer em um.
Ben Millwood 29/02

17
De quem nasceu? Todas as pessoas na história? Hoje? Todas as pessoas vivas? Prospectivamente para o futuro? As probabilidades não têm sentido, a menos que os eventos a que se referem sejam bem definidos.
whuber

15
100% das pessoas nascidas hoje serão. Isso ajuda?
aslum 29/02

8
Muitos pais não querem que seus filhos nasçam no dia bissexto. Portanto, com o aumento das cesarianas programadas, a probabilidade será menor que um dia aleatório. fivethirtyeight.com/features/...
James Lawruk

3
Concordo com @whuber, que a questão está mal definida. Sem uma definição adequada do espaço de probabilidade, a pergunta não pode ser respondida. Daí o voto negativo.
Mvctas

Respostas:


24

Certo. Veja aqui uma explicação mais detalhada: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .

Mas, essencialmente, o autor conclui: "Existem 485 anos bissextos em 2 milênios. Portanto, em 2 milênios, existem total de dias. Desses dias, 29 de fevereiro ocorre em 485 deles (os anos bissextos), então a probabilidade é de 485 / 730485 = 0,0006639424 "485(366)+(2000-485)(365)=730485485/730485=0.0006639424


9
Por que não pode ser calculado como 1 / (Número de dias em 4 anos) = 1/1461 = 0,00068 ?
Siddhesh

21
@ Sidhesh Existe uma regra em relação aos séculos. Então, por exemplo, 2100 não é um ano bissexto
Rentrop 29/02

8
@ Sidhesh, infelizmente, não é tão simples assim. Anos bissextos um pouco mais complexos. Uma duração média do ano é realmente, em média, 365,2425 dias e não 365,25. Como está escrito na página do ano bissexto da wikipedia, "O calendário gregoriano ... remove três dias bissextos a cada 400 anos, que é a duração do seu ciclo bissexto. Isso é feito removendo 29 de fevereiro nos três anos do século (múltiplos de 100) isso não pode ser exatamente dividido por 400. [3] Os anos 2000 e 2400 são anos bissextos, enquanto 1800, 1900, 2100, 2200, 2300 e 2500 são anos comuns ".
StatsStudent

10
Não vejo por que você precisa considerar 2000 anos; os anos bissextos estão em um ciclo de 400 anos, então por que não reduzir a "há 97 anos bissextos em 400 anos"?
Philip Kendall

7
Por que devemos considerar influências menores como os dias bissextos "cancelados" nos anos do século, não múltiplos de 400, mas por outro lado não levamos em consideração influências externas, como quase todos os nascimentos atrasados ​​ou introduzidos antes de 29 de fevereiro, apenas para economizar a criança da inconveniência (ou outras razões)? - Pelo menos aqui na Alemanha, a probabilidade de um nascimento ocorrer em 29 de fevereiro é (estimada) quase nula.
Estou com Monica em

23

Para prever com precisão essa probabilidade usando estatísticas, seria útil saber onde o nascimento ocorreu.

Esta página http://chmullig.com/2012/06/births-by-day-of-year/ possui um gráfico que mostra um subconjunto do número de nascimentos por dia (multiplicando o 29 por 4, o que é incorreto e indesejável para esta pergunta, mas também se vincula aos dados originais e fornece uma indicação aproximada do que você pode esperar) nos Estados Unidos. Eu diria que essa curva não se aplica a outros países, e especialmente a outros continentes. Em particular, o hemisfério sul e a região equatorial podem mostrar uma derivação substancial desses resultados - assumindo que o clima seja um fator determinante.

Além disso, há a questão do "nascimento eletivo" (abordado pelos autores de http://bmjopen.bmj.com/content/3/8/e002920.full ) - nas regiões mais pobres do mundo, eu esperaria uma diferença distribuição de nascimentos, simplesmente porque cesarianas (não emergenciais) ou parto induzido são mais raras do que nos países desenvolvidos. Isso distorce a distribuição final de nascimentos.

Usando os dados americanos, assumindo ~ 71 milhões de nascimentos (média gráfica aproximada * 366) e 46.000 nascimentos em 29 de fevereiro, não corrigindo a distribuição de anos bissextos nos dados, porque o período preciso não é indicado, chego a uma probabilidade de em torno de ~ 0,000648. Isso está um pouco abaixo do valor que se esperaria, dada uma distribuição plana de nascimentos e, portanto, em consonância com a impressão geral fornecida pelo gráfico.

Vou deixar um teste de significância dessa estimativa grosseira para um leitor motivado. Mas, como o 29º (embora não corrigido - o ano 2000 injeta um viés abaixo da média nos dados) tem uma pontuação baixa, mesmo para os já baixos padrões de fevereiro, assumo uma confiança relativamente alta de que a hipótese nula de distribuição igualitária possa ser rejeitada.


1
O conjunto de dados tem datas de 30 e 31 de fevereiro. Isso é engraçado. Ele precisa de uma boa limpeza antes da análise, mas possui muitos dados, o que é ótimo.
Aksakal

22

Penso que a resposta a esta pergunta só pode ser empírica. Qualquer resposta teórica seria falha sem os fenômenos de seleção de aniversário contábil, sazonalidade etc. Essas coisas são impossíveis de lidar teoricamente.

É difícil encontrar dados de aniversário nos EUA por motivos de privacidade. Há um conjunto de dados anônimos aqui . É de aplicações de seguros nos EUA. A diferença em relação a outros relatórios, como um artigo popular do NYT frequentemente citado , é que ele lista a frequência de nascimentos por data, em vez da simples classificação de dias em um ano. O ponto fraco é, obviamente, o viés de amostragem, uma vez que vem do seguro: pessoas sem seguro não estão incluídas etc.

De acordo com os dados, houve 325 nascimentos em 29 de fevereiro do total de 481040. Segundo Roy Murphy , a amostra abrange de 1981 a 1994. Inclui 3 anos bissextos do total de 14 anos. Sem nenhum ajuste, a probabilidade seria de 0,0675% do nascimento em 29 de fevereiro entre 1981 e 1994.

Você pode ajustar a probabilidade de contabilidade para a frequência de anos bissextos, que está perto de 1/4 ( não exatamente embora ), por exemplo, multiplicando esse número por para chegar a 0,079% estimativa. Aqui, a probabilidade condicional p de nascer em 29 de fevereiro em um ano bissexto está ligada à frequência observada F o = 325 pela frequência f L = 3 dos anos bissextos em uma amostra: F o = f L / N F p , onde N = 1414/12pFo=325feu=3

Fo=feu/NFp,
N=14é o número de anos em uma amostra e é a frequência total de nascimentos.F=481040

Normalmente, a probabilidade de anos salto é , por conseguinte, a longo prazo, a probabilidade média P L de ser carregado, em 29 de fevereiro é: P L = p Lp p LNpeu1/4Peu

Peu=peuppeuNfeuFoF0,079%

Você pode estar interessado na probabilidade condicional de ter nascido em 29 de fevereiro, uma vez que você nasceu em ano bissexto: p = Np

p=NfeuFoF0,32%

Peup

Obviamente, essa discussão foi centrada nos EUA. Quem sabe quais são os padrões em outros países.

ATUALIZAÇÃO: Assumimos automaticamente que OP é um calendário gregoriano. Fica ainda mais interessante se você considerar calendários diferentes, como o calendário lunar islâmico , onde os anos bissextos são a cada 30 anos.

ATUALIZAÇÃO 2:

pFp=1,527Amitabh Chandra, Harvard University

Agora, qual a probabilidade de dias muito peculiares no calendário gregoriano: 1º de janeiro, 25 de dezembro e 29 de dezembro virem aleatoriamente como os aniversários mais populares? Eu digo que é altamente improvável uma ocorrência aleatória. Portanto, é ainda mais interessante ver o que está acontecendo em outros calendários, como o Hijri.

ATUALIZAÇÃO 3:

Peu,p

p^1/3660,27
P^eup3663654+10,068

ATUALIZAÇÃO 4:

χ2

14365+3

d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs

idL = 60; % index of Feb 29

% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days

fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;

fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))

% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on

% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)

SAÍDA:

non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000

h =

     1


p =

     0

insira a descrição da imagem aqui


3
É uma análise útil (+1). Isso me faz pensar sobre que conexão existe, se houver, entre as frequências que você analisa e a probabilidade (vagamente definida) solicitada na pergunta.
whuber

1
@whuber, as probabilidades na minha resposta são para casos como análise de aplicativos de seguros ou alguns dados do usuário. Por exemplo, você tem um site e deseja sinalizar dados problemáticos do usuário. Você pode comparar a frequência dos aniversários de 29 de fevereiro com as minhas probabilidades. No entanto, se você está planejando uma família e fazendo essa pergunta, meus números são praticamente inúteis. A razão é que eles não são responsáveis ​​por fatores como quando exatamente o casal está copulando ou padrões de fertilidade e período dos casais, por exemplo, que é o principal determinante da data do dia do nascimento.
Aksakal

Fico feliz em ver que você não começar com a matemática antes de considerar outros fatores, além estatísticas puras
TheBlastOne

8

A capa do meu livro favorito sempre fornece algumas evidências altamente relevantes contra a suposição de uma alocação uniforme de nascimentos até a data. Especificamente, os nascimentos nos EUA desde 1970 exibem várias tendências sobrepostas umas às outras: uma tendência longa, de várias décadas, uma tendência não periódica, tendências do dia da semana, tendências do dia do ano, tendências de férias (porque procedimentos como cesariana permite agendar efetivamente a data de nascimento, e os médicos geralmente não fazem isso nos feriados). O resultado é que a probabilidade de nascer em um dia escolhido aleatoriamente em um ano não é uniforme e, como a taxa de natalidade varia entre os anos, nem todos os anos são igualmente prováveis.

Isso também fornece evidências de que a solução da Asksal, embora seja uma concorrente muito forte, também está incompleta. Um pequeno número de dias bissextos será "contaminado" por todos os efeitos em jogo aqui, então a estimativa de Asksal também está capturando (por acaso) o efeito das tendências do dia da semana e de longo prazo, juntamente com o dia 29 de fevereiro efeito. Quais efeitos são e não são apropriados para incluir não são claramente definidos pela sua pergunta.

E essa análise só tem influência nos EUA, que têm tendências demográficas que podem ser bem diferentes de outras nações ou populações. A taxa de natalidade do Japão vem declinando há décadas, por exemplo. A taxa de natalidade da China é regulada pelo estado, com algumas conseqüências para a composição de gênero de seu país e, portanto, as taxas de natalidade nas gerações subseqüentes.

Da mesma forma, a análise de Gelman descreve apenas várias décadas recentes, e não está necessariamente claro que essa seja a época de seu interesse.

insira a descrição da imagem aqui

Para quem se empolga com esse tipo de coisa, o material da capa é discutido detalhadamente no capítulo sobre processos gaussianos.


2
Uma breve descrição do modelo usado também está disponível na postagem do blog aqui: andrewgelman.com/2012/06/19/…
Sakari Cajanus

3

29 de fevereiro é uma data que ocorre a cada ano com um múltiplo de 4 .

No entanto, anos múltiplos de 100, mas não 400, não são considerados como anos bissextos (por exemplo: 1900 não é um ano bissexto, enquanto 2000 ou 1600 são). Portanto, hoje em dia, é o mesmo padrão a cada 400 anos.

Então, vamos fazer as contas em um intervalo [0; 400 [ :

Em um período de 400 anos, há exatamente 4 x 25 = 100 anos que são múltiplos de 4 . Mas temos que subtrair 3 (anos múltiplos de 100, mas não 400) de 100, e obtemos 100 - 3 = 97 anos.

Agora temos que multiplicar 97 por 366, 97 x 366 = 35502 (número de dias em um ano bissexto em um período de 400 anos), ele permanece (365 x (400-97)) = 110 595 (número de dias que não são ' t em um ano bissexto em um período de 400 anos).

Depois, basta adicionar esses dois números para saber o número total de dias em um período de 400 anos: 110 595 + 35502 = 146 097 .

Para terminar, nossa probabilidade é o número de 29 de fevereiro em um período de 400 anos, portanto 97, considerando que existem 97 anos bissextos divididos pelo número total de dias de nosso intervalo:

p = 97/146097 ≈ 0,0006639424492

Espero que isso esteja certo e claro.


7
Esta é uma boa análise da chance de uma data escolhida aleatoriamente ser 29 de fevereiro. Acredito que a maior parte da discussão neste tópico se concentra no fato de que isso realmente não responde a perguntas sobre chances de nascimento, que realmente não se comportam como sorteios aleatórios do conjunto de dias possíveis.
whuber

1
Uma maneira muito mais fácil é dizer que existem 97 anos bissextos a cada 400 anos da maneira que você já trabalhou. Calcule o número de dias em 400 anos normais. 400 * 365 = 146000. Em seguida, você precisa adicionar os dias 97 bissextos dando 146097.
CJ Dennis

2

Eu acredito que há duas perguntas sendo misturadas aqui. O primeiro é "Qual é a probabilidade de um dia ser 29 de fevereiro?". O segundo é (e o que realmente perguntou) "Qual é a probabilidade de nascer em um dia bissexto?"

p=971460970 0,00066394

3149740097400143=6796001.131667)

Finalmente, há uma terceira interpretação possível da pergunta, que acredito não ter sido pretendida: "Qual é a probabilidade de uma pessoa específica nascer em um dia bissexto?" Bem, para quem já nasceu, isso é fácil. É ou0 0 ou 1. Para quem não nasceu, mas já concebeu, também pode ser estimado usando estudos empíricos sobre a duração da gravidez (consulte a Wikipedia para uma visão geral ). Para quem ainda não concebeu, veja acima.


2
Errr, eu estava pronto para votar e depois cheguei em Bem, para quem já nasceu que é fácil. É 0 ou 1. Não.
mattdm 2/16/16

Eu acho que isso depende um pouco da interpretação das probabilidades. Suponha que eu joguei uma moeda. Eu olhei para ele e sei o resultado (por exemplo, cabeças). Você está ao meu lado, mas ainda não viu o resultado. Qual é a probabilidade da moeda mostrar cara (para você, para mim, "objetivamente")? No exemplo acima: para a pessoa dada (nascida), a probabilidade é 0 ou 1 (supondo que ele saiba em que data nasceu). Se você escolhe uma pessoa aleatoriamente e precisa adivinhar o aniversário dele, a probabilidade de ser um dia 29 de fevereiro é mais uma vez uma questão empírica.
data_enthusiast

1

Percebi que a maioria das respostas acima resolve isso calculando o número de dias bissextos em um determinado período. Existe uma maneira mais simples de obter a resposta, 100% com precisão, por definição:

Usamos anos bissextos para ajustar o calendário regular (365 dias) ao ano tropical médio (também conhecido como ano solar médio). O ano tropical médio "é o tempo que o Sol leva para retornar à mesma posição no ciclo das estações, como visto na Terra" (Wikipedia). O ano tropical varia um pouco, mas o ano tropical médio (médio) é de cerca de 365,24667.

Se os dias bissextos estiverem corretos, a chance de um dia selecionado aleatoriamente ser um dia bissexto é de ((ano tropical) - (ano não bissexto)) / ano tropical

Conectando o número aproximado que temos, é (365.24667-365) /365.24667, ou 0.24667 / 365.24667, ou 675 por milhão (0,0675%).

Este, no entanto, é para um dia selecionado aleatoriamente. Imagino que isso seja substancialmente distorcido pelos pais que preferem não precisar explicar aos filhos: "o seu aniversário real acontece apenas uma vez a cada quatro anos".


3
Acho que isso não responde à pergunta que está sendo feita, porque o dia bissexto, 29 de fevereiro, existe apenas em determinados sistemas de calendário. Esses sistemas de calendário foram utilizados apenas em sociedades específicas durante as recentes eras históricas. Por exemplo, esta pergunta não é inteligível para alguém que calcula o tempo usando o calendário hebraico, que não tem "fevereiro"! Além disso, mesmo se assumirmos um calendário com um dia bissexto, ele ainda não resolve a indeterminação em torno da distribuição de probabilidade de nascimentos por dias.
Sycorax diz Restabelecer Monica

@ user777, isso é irrelevante. Se você pertence a uma cultura que não reconhece dia bissexto, ainda haveria indivíduos que nascem em nosso dia bissexto.
Octopus

1
@ Octopus Não se tivessem nascido antes de outubro de 1582, mês em que o calendário gregoriano foi introduzido. A questão não é específica o suficiente para permitir discernir quais populações estão sendo consideradas, e é por isso que meu comentário é criticamente relevante.
Sycorax diz Restabelecer Monica

@ user777, você está cortando cabelos. A questão é que o calendário gregoriano existe hoje e pode ser usado para colocar todos os dias na história, independentemente de eles o terem observado naquele momento.
Octopus

1
@ Octopus Como você sabe que é esse o ponto?
Sycorax diz Restabelecer Monica

-4

Perguntei à minha irmã, cujo aniversário é 29 de fevereiro, e ela disse: "O resultado do meu próprio estudo empírico foi que são 1,00, obviamente".


Bem, parece que não foi apreciado. Notado.
John Smith
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.