Como foi apontado, as expectativas simplesmente aumentam.
No entanto, sabendo que a expectativa não é muito útil, você também precisa ter uma noção da provável variação em torno dela.
Você precisa se preocupar com três coisas:
variação nos indivíduos em torno de suas expectativas (uma pessoa com 60% de chance de chegar na verdade não atinge sua expectativa; ela está sempre acima ou abaixo dela)
dependência entre pessoas. Os casais que podem vir ambos tendem a comparecer ou não. As crianças pequenas não comparecem sem os pais. Em alguns casos, algumas pessoas podem evitar a vinda se souberem que outra pessoa estará lá.
erro na estimativa das probabilidades. Essas probabilidades são apenas suposições; convém considerar o efeito de suposições um pouco diferentes (talvez as avaliações de alguém sobre esses números)
O primeiro é passível de cálculo, por aproximação normal ou por simulação. O segundo pode ser simulado sob várias suposições, específicas para as pessoas ou considerando alguma distribuição de dependências. (O terceiro item é mais difícil.)
Editado para responder às perguntas de acompanhamento nos comentários:
Se eu entendo o seu fraseado corretamente, para a família de 4, você tem 50% de chance de cada uma das 4 pessoas ou nenhuma vir. Esse é um número esperado de 2, certamente, mas você também gostaria de ter uma idéia da variabilidade em torno da expectativa. Nesse caso, você provavelmente deseja manter a situação real de 50% de 0/50% de 4.
Se você puder particionar todos em grupos independentes, uma boa primeira aproximação (com muitos desses grupos) seria adicionar os meios e as variações entre os grupos independentes e tratar a soma como normal (talvez com correção de continuidade). Uma abordagem mais precisa seria simular o processo ou calcular a distribuição exatamente via convolução numérica; Embora as duas abordagens sejam diretas, esse é um nível desnecessário de precisão para esta aplicação em particular, já que já existem muitas camadas de aproximação - é como dizer as dimensões de uma sala ao pé mais próximo e calcular a quantidade de tinta necessária ao mililitro mais próximo - a precisão adicional é inútil.
Imagine (por simplicidade), tivemos quatro grupos:
1) grupo A (1 indivíduo) - 70% de chance de comparecimento
2) grupo B (1 indivíduo) - 60% de chance de comparecimento
3) grupo C (família de 4) - 0: 0,5 4: 0,5 (se alguém ficar em casa, ninguém virá)
4) grupo D (casal de 2) - 0: 0,4 1: 0,1 2: 0,5 (ou seja, 50% de chance de ambos, mais 10% de chance de que exatamente um venha, por exemplo, se o outro tiver compromissos de trabalho ou estiver doente)
Em seguida, obtemos os seguintes meios e variações:
mean variance
A 0.7 0.21
B 0.6 0.24
C 2.0 4.0
D 1.1 0.89
Tot 4.4 5.34
Portanto, uma aproximação normal será bastante difícil nesse caso, mas sugeriria que mais de 7 pessoas seriam muito improváveis (da ordem de 5%) e 6 ou menos ocorreriam aproximadamente 75-80% das vezes.
[Uma abordagem mais precisa seria simular o processo, mas no problema completo, e não no exemplo de corte, isso provavelmente é desnecessário, pois já existem tantas camadas de aproximação.]
Depois de ter sua distribuição combinada que incorpora essas dependências de grupo, você poderá aplicar todas as fontes de dependência conjunta geral (como condições meteorológicas severas) - ou pode simplesmente garantir ou mesmo ignorar tais eventualidades, dependendo das circunstâncias .