Dado que hoje é um dia bissexto, alguém sabe a probabilidade de nascer em um dia bissexto?
Dado que hoje é um dia bissexto, alguém sabe a probabilidade de nascer em um dia bissexto?
Respostas:
Certo. Veja aqui uma explicação mais detalhada: http://www.public.iastate.edu/~mlamias/LeapYear.pdf .
Mas, essencialmente, o autor conclui: "Existem 485 anos bissextos em 2 milênios. Portanto, em 2 milênios, existem total de dias. Desses dias, 29 de fevereiro ocorre em 485 deles (os anos bissextos), então a probabilidade é de 485 / 730485 = 0,0006639424 "
Para prever com precisão essa probabilidade usando estatísticas, seria útil saber onde o nascimento ocorreu.
Esta página http://chmullig.com/2012/06/births-by-day-of-year/ possui um gráfico que mostra um subconjunto do número de nascimentos por dia (multiplicando o 29 por 4, o que é incorreto e indesejável para esta pergunta, mas também se vincula aos dados originais e fornece uma indicação aproximada do que você pode esperar) nos Estados Unidos. Eu diria que essa curva não se aplica a outros países, e especialmente a outros continentes. Em particular, o hemisfério sul e a região equatorial podem mostrar uma derivação substancial desses resultados - assumindo que o clima seja um fator determinante.
Além disso, há a questão do "nascimento eletivo" (abordado pelos autores de http://bmjopen.bmj.com/content/3/8/e002920.full ) - nas regiões mais pobres do mundo, eu esperaria uma diferença distribuição de nascimentos, simplesmente porque cesarianas (não emergenciais) ou parto induzido são mais raras do que nos países desenvolvidos. Isso distorce a distribuição final de nascimentos.
Usando os dados americanos, assumindo ~ 71 milhões de nascimentos (média gráfica aproximada * 366) e 46.000 nascimentos em 29 de fevereiro, não corrigindo a distribuição de anos bissextos nos dados, porque o período preciso não é indicado, chego a uma probabilidade de em torno de ~ 0,000648. Isso está um pouco abaixo do valor que se esperaria, dada uma distribuição plana de nascimentos e, portanto, em consonância com a impressão geral fornecida pelo gráfico.
Vou deixar um teste de significância dessa estimativa grosseira para um leitor motivado. Mas, como o 29º (embora não corrigido - o ano 2000 injeta um viés abaixo da média nos dados) tem uma pontuação baixa, mesmo para os já baixos padrões de fevereiro, assumo uma confiança relativamente alta de que a hipótese nula de distribuição igualitária possa ser rejeitada.
Penso que a resposta a esta pergunta só pode ser empírica. Qualquer resposta teórica seria falha sem os fenômenos de seleção de aniversário contábil, sazonalidade etc. Essas coisas são impossíveis de lidar teoricamente.
É difícil encontrar dados de aniversário nos EUA por motivos de privacidade. Há um conjunto de dados anônimos aqui . É de aplicações de seguros nos EUA. A diferença em relação a outros relatórios, como um artigo popular do NYT frequentemente citado , é que ele lista a frequência de nascimentos por data, em vez da simples classificação de dias em um ano. O ponto fraco é, obviamente, o viés de amostragem, uma vez que vem do seguro: pessoas sem seguro não estão incluídas etc.
De acordo com os dados, houve 325 nascimentos em 29 de fevereiro do total de 481040. Segundo Roy Murphy , a amostra abrange de 1981 a 1994. Inclui 3 anos bissextos do total de 14 anos. Sem nenhum ajuste, a probabilidade seria de 0,0675% do nascimento em 29 de fevereiro entre 1981 e 1994.
Você pode ajustar a probabilidade de contabilidade para a frequência de anos bissextos, que está perto de 1/4 ( não exatamente embora ), por exemplo, multiplicando esse número por para chegar a 0,079% estimativa. Aqui, a probabilidade condicional p de nascer em 29 de fevereiro em um ano bissexto está ligada à frequência observada F o = 325 pela frequência f L = 3 dos anos bissextos em uma amostra: F o = f L / N ⋅ F ⋅ p , onde N = 14
Normalmente, a probabilidade de anos salto é , por conseguinte, a longo prazo, a probabilidade média P L de ser carregado, em 29 de fevereiro é: P L = p L ⋅ p ≈ p L ⋅ N
Você pode estar interessado na probabilidade condicional de ter nascido em 29 de fevereiro, uma vez que você nasceu em ano bissexto: p = N
Obviamente, essa discussão foi centrada nos EUA. Quem sabe quais são os padrões em outros países.
ATUALIZAÇÃO: Assumimos automaticamente que OP é um calendário gregoriano. Fica ainda mais interessante se você considerar calendários diferentes, como o calendário lunar islâmico , onde os anos bissextos são a cada 30 anos.
ATUALIZAÇÃO 2:
Amitabh Chandra, Harvard University
Agora, qual a probabilidade de dias muito peculiares no calendário gregoriano: 1º de janeiro, 25 de dezembro e 29 de dezembro virem aleatoriamente como os aniversários mais populares? Eu digo que é altamente improvável uma ocorrência aleatória. Portanto, é ainda mais interessante ver o que está acontecendo em outros calendários, como o Hijri.
ATUALIZAÇÃO 3:
ATUALIZAÇÃO 4:
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
SAÍDA:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
A capa do meu livro favorito sempre fornece algumas evidências altamente relevantes contra a suposição de uma alocação uniforme de nascimentos até a data. Especificamente, os nascimentos nos EUA desde 1970 exibem várias tendências sobrepostas umas às outras: uma tendência longa, de várias décadas, uma tendência não periódica, tendências do dia da semana, tendências do dia do ano, tendências de férias (porque procedimentos como cesariana permite agendar efetivamente a data de nascimento, e os médicos geralmente não fazem isso nos feriados). O resultado é que a probabilidade de nascer em um dia escolhido aleatoriamente em um ano não é uniforme e, como a taxa de natalidade varia entre os anos, nem todos os anos são igualmente prováveis.
Isso também fornece evidências de que a solução da Asksal, embora seja uma concorrente muito forte, também está incompleta. Um pequeno número de dias bissextos será "contaminado" por todos os efeitos em jogo aqui, então a estimativa de Asksal também está capturando (por acaso) o efeito das tendências do dia da semana e de longo prazo, juntamente com o dia 29 de fevereiro efeito. Quais efeitos são e não são apropriados para incluir não são claramente definidos pela sua pergunta.
E essa análise só tem influência nos EUA, que têm tendências demográficas que podem ser bem diferentes de outras nações ou populações. A taxa de natalidade do Japão vem declinando há décadas, por exemplo. A taxa de natalidade da China é regulada pelo estado, com algumas conseqüências para a composição de gênero de seu país e, portanto, as taxas de natalidade nas gerações subseqüentes.
Da mesma forma, a análise de Gelman descreve apenas várias décadas recentes, e não está necessariamente claro que essa seja a época de seu interesse.
Para quem se empolga com esse tipo de coisa, o material da capa é discutido detalhadamente no capítulo sobre processos gaussianos.
29 de fevereiro é uma data que ocorre a cada ano com um múltiplo de 4 .
No entanto, anos múltiplos de 100, mas não 400, não são considerados como anos bissextos (por exemplo: 1900 não é um ano bissexto, enquanto 2000 ou 1600 são). Portanto, hoje em dia, é o mesmo padrão a cada 400 anos.
Então, vamos fazer as contas em um intervalo [0; 400 [ :
Em um período de 400 anos, há exatamente 4 x 25 = 100 anos que são múltiplos de 4 . Mas temos que subtrair 3 (anos múltiplos de 100, mas não 400) de 100, e obtemos 100 - 3 = 97 anos.
Agora temos que multiplicar 97 por 366, 97 x 366 = 35502 (número de dias em um ano bissexto em um período de 400 anos), ele permanece (365 x (400-97)) = 110 595 (número de dias que não são ' t em um ano bissexto em um período de 400 anos).
Depois, basta adicionar esses dois números para saber o número total de dias em um período de 400 anos: 110 595 + 35502 = 146 097 .
Para terminar, nossa probabilidade é o número de 29 de fevereiro em um período de 400 anos, portanto 97, considerando que existem 97 anos bissextos divididos pelo número total de dias de nosso intervalo:
p = 97/146097 ≈ 0,0006639424492
Espero que isso esteja certo e claro.
Eu acredito que há duas perguntas sendo misturadas aqui. O primeiro é "Qual é a probabilidade de um dia ser 29 de fevereiro?". O segundo é (e o que realmente perguntou) "Qual é a probabilidade de nascer em um dia bissexto?"
)
Finalmente, há uma terceira interpretação possível da pergunta, que acredito não ter sido pretendida: "Qual é a probabilidade de uma pessoa específica nascer em um dia bissexto?" Bem, para quem já nasceu, isso é fácil. É ou ou . Para quem não nasceu, mas já concebeu, também pode ser estimado usando estudos empíricos sobre a duração da gravidez (consulte a Wikipedia para uma visão geral ). Para quem ainda não concebeu, veja acima.
Percebi que a maioria das respostas acima resolve isso calculando o número de dias bissextos em um determinado período. Existe uma maneira mais simples de obter a resposta, 100% com precisão, por definição:
Usamos anos bissextos para ajustar o calendário regular (365 dias) ao ano tropical médio (também conhecido como ano solar médio). O ano tropical médio "é o tempo que o Sol leva para retornar à mesma posição no ciclo das estações, como visto na Terra" (Wikipedia). O ano tropical varia um pouco, mas o ano tropical médio (médio) é de cerca de 365,24667.
Se os dias bissextos estiverem corretos, a chance de um dia selecionado aleatoriamente ser um dia bissexto é de ((ano tropical) - (ano não bissexto)) / ano tropical
Conectando o número aproximado que temos, é (365.24667-365) /365.24667, ou 0.24667 / 365.24667, ou 675 por milhão (0,0675%).
Este, no entanto, é para um dia selecionado aleatoriamente. Imagino que isso seja substancialmente distorcido pelos pais que preferem não precisar explicar aos filhos: "o seu aniversário real acontece apenas uma vez a cada quatro anos".
Perguntei à minha irmã, cujo aniversário é 29 de fevereiro, e ela disse: "O resultado do meu próprio estudo empírico foi que são 1,00, obviamente".