Resposta rápida
O motivo é que, assumindo que os dados são iid e e definindo
ˉ XXi∼N(μ,σ2)
ao formar intervalos de confiança, a distribuição da amostra associada à variância da amostra (S2, lembre-se, uma variável aleatória!) É uma distribuição qui-quadrado (S2(N-1)/σ2∼χ2n-1), assim como a distribuição da amostra associada à média da amostra é uma distribuição normal padrão ((ˉX-μ)√
S2S2(N−1)/σ2∼χ2n−1) quando você conhece a variação, e com um aluno t quando você não (
( ˉ X -μ) √(X¯−μ)n−−√/σ∼Z(0,1) ).
Resposta longa
Primeiramente, provaremos que segue uma distribuição qui-quadrado com N - 1S2(N−1)/σ2N−1 graus de liberdade. Depois disso, veremos como essa prova é útil ao derivar os intervalos de confiança para a variação e como a distribuição do qui-quadrado aparece (e por que é tão útil!). Vamos começar.
A prova
Para isso, talvez você precise se acostumar com a distribuição do qui-quadrado neste artigo da Wikipedia . Essa distribuição possui apenas um parâmetro: os graus de liberdade, , e passa a ter uma Função Geradora de Momento (MGF) dada por:
m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 .
Se pudermos mostrar que a distribuição de S 2 ( N - 1 ) / σ 2 tem uma função geradora de momentos como esta, mas com ν Nν
S2(N−1)/σ2 , mostramos que
S 2 ( N - 1 ) / σ 2 segue uma distribuição qui-quadrado com
N - 1 graus de liberdade. Para mostrar isso, observe dois fatos:
Se definirmos,
ondeZi~N(0,1), isto é, variáveis aleatória normal, a função de geração de momento deYé dada por
m Y (t)
The MGF of Z2 is given by
where I have used the PDF of the standard normal, f(z)=e−z2/2/2π−−√ and, hence,
which implies that Y follows a chi-square distribution with N degrees of freedom.
Y1Y2ν1ν2 degrees of freedom, then W=Y1+Y2 distributes with a chi-square distribution with ν1+ν2 degrees of freedom (this follows from taking the MGF of W; do this!).
With the above facts, note that if you multiply the sample variance by N−1, you obtain (after some algebra),
and, hence, dividing by
Note that the second term in the left-side of this sum distributes as a chi-square distribution with 1 degree of freedom, and the right-hand side sum distributes as a chi-square with
N degrees of freedom.
Therefore, S2(N−1)/σ2 distributes as a chi-square with N−1 degrees of freedom.
Calculating the Confidence Interval for the variance.
When looking for a confidence interval for the variance, you want to know the limits L1 and L2 in
Let's play with the inequality inside the parenthesis. First, divide by
And then remember two things: (1) the statistic
S2(N−1)/σ2 has a chi-squared distribution with
N−1 degrees of freedom and (2) the variances is always greather than zero, which implies that you can invert the inequalities, because
hence, the probability we are looking for is:
Note that
S2(N−1)/σ2∼χ2(N−1). We want then,
∫N−1S2(N−1)L2pχ2(x)dx∫S2(N−1)L1N−1pχ2(x)dx==(1−α)/2 ,(1−α)/2
(we integrate up to
N−1 because the expected value of a chi-squared random variable with
N−1 degrees of freedom is
N−1) or, equivalently,
χ2α/2=S2(N−1)L2 and
χ21−α/2=S2(N−1)L1, where the values
χ2α/2 and
χ21−α/2 can be found in chi-square tables (in computers mainly!) and solving for
L1 and
Hence, your confidence interval for the variance is