A variabilidade que está diminuindo quando N aumenta é a variabilidade da média da amostra, geralmente expressa como erro padrão. Ou, em outros termos, a certeza da veracidade da média da amostra está aumentando.
Imagine que você realize um experimento em que coleciona 3 homens e 3 mulheres e mede suas alturas. Você tem certeza de que as alturas médias de cada grupo são a verdadeira média das populações separadas de homens e mulheres? Eu deveria pensar que você não teria muita certeza. Você pode coletar facilmente novas amostras de 3 e encontrar novos meios a vários centímetros das primeiras. Algumas das experiências repetidas como essa podem até resultar em mulheres sendo pronunciadas mais altas que os homens, porque os meios variam muito. Com um N baixo, você não tem muita certeza na média da amostra e isso varia muito entre as amostras.
Agora imagine 10.000 observações em cada grupo. Vai ser muito difícil encontrar novas amostras de 10.000 que tenham meios que diferem muito um do outro. Eles serão muito menos variáveis e você terá mais certeza da precisão deles.
Se você pode aceitar essa linha de pensamento, podemos inseri-la nos cálculos de suas estatísticas como erro padrão. Como você pode ver na equação, é uma estimativa de um parâmetro, (que deve se tornar mais preciso à medida que n aumenta) dividido por um valor que sempre aumenta com n, . Esse erro padrão está representando a variabilidade dos meios ou efeitos em seus cálculos. Quanto menor, mais poderoso é o seu teste estatístico.σn--√
Aqui está uma pequena simulação em R para demonstrar a relação entre um erro padrão e o desvio padrão das médias de muitas e muitas repetições do experimento inicial. Nesse caso, começaremos com uma média populacional de 100 e desvio padrão de 15.
mu <- 100
s <- 50
n <- 5
nsim <- 10000 # number of simulations
# theoretical standard error
s / sqrt(n)
# simulation of experiment and the standard deviations of their means
y <- replicate( nsim, mean( rnorm(n, mu, s) ) )
sd(y)
Observe como o desvio padrão final está próximo do erro padrão teórico. Ao brincar com a variável n aqui, você pode ver que a medida de variabilidade será menor à medida que n aumenta.
[Como um aparte, a curtose nos gráficos não está realmente mudando (supondo que sejam distribuições normais). Diminuir a variação não altera a curtose, mas a distribuição parecerá mais estreita. A única maneira de examinar visualmente as alterações da curtose é colocar as distribuições na mesma escala.]