n ( N - 1 ) / N = 1 - ( 1 / N ) 1 - 2 / N 1 - 17 / N exp ( - 1 / N )N é o tamanho da população e é o tamanho da amostra. A questão pergunta por que a variação populacional é o desvio médio quadrático da média, em vez de vezes. Por falar nisso, por que parar por aí? Por que não multiplicar o desvio médio quadrático por ou ou , por exemplo?n(N−1)/N=1−(1/N)1−2/N1−17/Nexp(−1/N)
Na verdade, há uma boa razão para não fazê-lo. Qualquer uma dessas figuras que acabei de mencionar serviria como uma maneira de quantificar uma "propagação típica" dentro da população. No entanto, sem o conhecimento prévio do tamanho da população, seria impossível usar uma amostra aleatória para encontrar um estimador imparcial de tal figura. Sabemos que a variação da amostra , que multiplica o desvio médio quadrático da média da amostra por , é um estimador imparcial da variação usual da população ao amostrar com substituição. (Não há problema em fazer essa correção, porque sabemos que !). A variação da amostra seria, portanto, um estimador tendencioso de qualquer múltiplo da variação da população em que esse múltiplo, comon 1 - 1 / N(n−1)/nn1−1/N, não é exatamente conhecido de antemão.
Esse problema de uma quantidade desconhecida de viés se propagaria a todos os testes estatísticos que usam a variação da amostra, incluindo testes t e testes F. De fato, dividir por qualquer coisa diferente de na fórmula de variação populacional exigiria a alteração de todas as tabulações estatísticas das estatísticas t e estatística F (e muitas outras tabelas também), mas o ajuste dependeria do tamanho da população. Ninguém quer ter que fazer mesas para todos os possíveis ! Especialmente quando não é necessário.NNN
Como uma questão prática, quando é pequeno o suficiente que o uso de em vez de em fórmulas faz a diferença, você costuma fazer conhecer o tamanho da população (ou pode adivinhar com precisão) e você provavelmente iria recorrer a muito mais substancial pequeno-população correções ao trabalhar com amostras aleatórias (sem substituição) da população. Em todos os outros casos, quem se importa? A diferença não importa. Por esses motivos, guiados por considerações pedagógicas (ou seja, focar em detalhes importantes e encobrir detalhes que não importam), alguns excelentes textos introdutórios de estatísticas nem se importam em ensinar a diferença: eles simplesmente fornecem uma fórmula de variação única ( dividido porN - 1 N N nNN−1NN ou conforme o caso).n