A população é o conjunto (hipotético) de todas as pessoas em risco de contrair a doença; geralmente, isso consiste em todas as pessoas (ou algum subgrupo claramente identificável) que residem na área de estudo. É importante definir claramente essa população, pois é o objetivo do estudo e de todas as inferências feitas a partir dos dados.
Quando os casos da doença são independentes (o que pode ser uma hipótese razoável quando a doença não é prontamente comunicada entre as pessoas e não é causada pelas condições ambientais locais) e eles são raros, as contagens devem seguir de perto uma distribuição de Poisson . Para esta distribuição, uma boa estimativa de seu desvio padrão é a raiz quadrada da contagem .
Usando essas heurísticas, os dados teriam desvios padrão associados de ( 13,4 , 9,5 , 6,7 eventos, o número real de doenças observadas durante uma temporada variará dessa taxa real. verdade( 180 , 90 , 45 , 210 )( 13,4 , 9,5 , 6,7 , 14,5 ) taxa (mas desconhecida!) Quantifica a quantidade de variação que provavelmente ocorrerá. Como as contagens observadas devem estar próximas das taxas verdadeiras, suas raízes quadradas devem ser proxies razoáveis para as raízes quadradas das taxas verdadeiras. Esses proxies são exatamente o que se entende por "erro padrão".
1657714,577
9( 20 , 10 , 5 , 23 )( 4.5 , 3.2 , 2.2 , 4.8 )9( 40 , 28,5 , 20 , 44 )
Isso é o mais longe possível com esses dados limitados. Esses cálculos simples revelaram que:
Caracterizar a população é fundamental,
A raiz quadrada de uma contagem é um ponto de partida aproximado para avaliar seu erro padrão,
A raiz quadrada deve ser multiplicada (aproximadamente) por algum fator para refletir a falta de independência nos casos da doença (e esse fator pode estar relacionado aproximadamente ao tamanho dos aglomerados de doenças),
A variação entre essas contagens reflete principalmente a variação da taxa de doenças ao longo do tempo, e não a incerteza (sobre a intensidade subjacente de Poisson).