Como
sabemos que
e, portanto, sabemos que para cada componente de ,
onde é o elemento diagonal de . Assim, sabemos que
β -β~N(0,σ2(XTX)-1)k β β k-βk~N(0,σ2Skk)Skkkth(XTX
β^=(XTX)−1XTY=(XTX)−1XT(Xβ+ε)=β+(XTX)−1XTε
β^−β∼N(0,σ2(XTX)−1)
kβ^β^k−βk∼N(0,σ2Skk)
Skkkth z k = β k - β k(XTX)−1zk=β^k−βkσ2Skk−−−−−√∼N(0,1).
Observe a declaração do teorema da distribuição de uma forma quadrática idempotente em um vetor normal padrão (teorema B.8 em Greene):
Se e é simétrica e idempotente, então é distribuído onde é o posto de .A x T A x χ 2 ν ν Ax∼N(0,I)AxTAxχ2ννA
Let denota o vetor residual de regressão e deixe
que é a matriz fabricante residual (ou seja, ) . É fácil verificar se é simétrico e idempotente . M=In-X(XTX)-1XT,My= ε Mε^
M=In−X(XTX)−1XT,
My=ε^M
Seja
um estimador de . σ2
s2=ε^Tε^n−p
σ2
Precisamos, então, fazer uma álgebra linear. Observe estas três propriedades da álgebra linear:
- A classificação de uma matriz idempotente é seu rastreio.
- Tr(A1+A2)=Tr(A1)+Tr(A2)
- Tr(A1A2)=Tr(A2A1) se for e for ( essa propriedade é essencial para o funcionamento abaixo )n 1 × n 2 A 2 n 2 × n 1A1n1×n2A2n2×n1
Portanto,
rank(M)=Tr(M)=Tr(In−X(XTX)−1XT)=Tr(In)−Tr(X(XTX)−1XT))=Tr(In)−Tr((XTX)−1XTX))=Tr(In)−Tr(Ip)=n−p
Então
V=(n−p)s2σ2=ε^Tε^σ2=(εσ)TM(εσ).
Aplicando o Teorema para a Distribuição de uma Forma Quadrática Idempotente em um Vetor Normal Padrão (declarado acima), sabemos que .V∼χ2n−p
Como você supôs que é normalmente distribuído, então é independente de e como é uma função de , então também é independente de . Assim, e são independentes um do outro.εβ^ε^s2ε^s2β^zkV
Então,
é a razão de uma distribuição normal padrão com a raiz quadrada de uma distribuição qui-quadrado com os mesmos graus de liberdade (isto é, ), que é uma caracterização da distribuição . Portanto, a estatística tem uma distribuição com graus de liberdade.
tk=zkV/(n−p)−−−−−−−−√
n−pttktn−p
Em seguida, ele pode ser manipulado algebricamente em uma forma mais familiar.
tk=β^k−βkσ2Skk√(n−p)s2σ2/(n−p)−−−−−−−−−−−−√=β^k−βkSkk√s2−−√=β^k−βks2Skk−−−−−√=β^k−βkse(β^k)