Para entender por que usamos a distribuição t, você precisa saber o que é a distribuição subjacente de β e da soma dos quadrados dos resíduos ( R S S ) uma vez que estes dois juntos put lhe dará a distribuição t.βˆRSS
A parte mais fácil é a distribuição de β que é uma distribuição normal - para ver esta nota que β = ( X T X ) - 1 X T Y por isso é uma função linear de Y onde Y ~ N ( X β , σ 2 I n ) . Como resultado, é também normalmente distribuída, β ~ N ( β , σ 2 ( X T X ) -βˆβˆ(XTX)−1XTYYY∼N(Xβ,σ2In)- deixe-me saber se você precisar de ajuda derivando a distribuição de β .βˆ∼N(β,σ2(XTX)−1)βˆ
Além disso, , onde n é o número de observações e p é o número de parâmetros utilizados na sua regressão. A prova disso é um pouco mais envolvente, mas também é fácil de obter (veja a prova aqui Por que o RSS é distribuído chi square times np? ).RSS∼σ2χ2n−pnp
Até este ponto eu considerei tudo na matriz / vetor notação, mas vamos para uso simplicidade β i e usar sua distribuição normal, que nos
dará: β i - β iβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
Além disso, a partir da distribuição qui-quadrado de , temos que:
( n - p ) s 2RSS
(n−p)s2σ2∼χ2n−p
Isso foi simplesmente um rearranjo da primeira expressão qui-quadrado e é independente do . Além disso, definimos s 2 = R S SN(0,1) , que é um estimador imparcial paraσ2. Pela definição da definiçãotn-pque divide uma distribuição normal por um qui-quadrado independente (sobre seus graus de liberdade) fornece uma distribuição t (para a prova, consulte:Uma normal dividida pela√s2=RSSn−pσ2tn−p fornece uma prova de distribuição tχ2(s)/s−−−−−−√), você obtém o seguinte:
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
Onde .s(XTX)−1ii−−−−−−−−√=SE(βˆi)
Deixe-me saber se faz sentido.