De fato, nem sempre "funciona" (no sentido de sempre melhorar a aproximação do binômio cdf pelo normal em qualquer x ). Se o binômio p for 0,5, acho que sempre ajuda, exceto, talvez, pela cauda mais extrema. Se p não estiver muito longe de 0,5, para razoavelmente grande n, geralmente funciona muito bem, exceto na extremidade mais distante, mas se p estiver próximo de 0 ou 1, pode não ajudar em nada (consulte o ponto 6. abaixo)
Uma coisa a ter em mente (apesar das ilustrações quase sempre envolvendo pmfs e pdfs) é que estamos tentando aproximar o cdf. Pode ser útil refletir sobre o que está acontecendo com o cdf do binômio e o normal aproximado (por exemplo, aqui está n=20,p=0.5 ):
No limite, o cdf de um binômio padronizado irá para um normal padrão (observe que a padronização afeta a escala no eixo x, mas não no eixo y); ao longo do caminho de cada vez maior n saltos do CDF binomial tendem a escarranchar mais uniformemente a CDF normal.
Vamos aumentar o zoom e ver isso no exemplo simples acima:
Observe que, como a aproximação normal passa perto do meio dos saltos verticais *, enquanto no limite, o cdf normal é localmente aproximadamente linear e (como é a progressão do cdf binomial no topo de cada salto); como resultado, o cdf tende a cruzar as etapas horizontais próximas a . Se você deseja aproximar o valor do cdf binomial,F(x)no número inteirox, o cdf normal atinge essa altura perto dex+1x+12F(x)x .x+12
* Se aplicarmos Berry-Esseen a variáveis Bernoulli corrigidas pela média, os limites de Berry-Esseen permitirão muito pouco espaço de manobra quando estiver próximo de 1p exestão próximos deμ- o cdf normal deve passar razoavelmente perto do meio dos saltos, porque, caso contrário, a diferença absoluta nos cdfs excederá o melhor limite de Berry-Essen de um lado ou de outro. Por sua vez, isso está relacionado à distância dex+112xμ o cdf normal pode cruzar parte horizontal da função de etapa do binômio cdf.x+12
Expandindo a motivação que em 1. vamos considerar como usaríamos uma aproximação normal ao binômio cdf para calcular . Por exemplo, n = 20 , p = 0,5 , k = 9 (veja o segundo diagrama acima). Portanto, nosso normal com a mesma média e sd é N ( 10 , ( √P(X=k)n=20,p=0.5,k=9. Observe que aproximamos o salto em cdf em 9 pela alteração no cdf normal entre 8,5 e 9,5.N(10,(5–√)2)