Na sua notação, é a projeção e o espaço da coluna de , ou seja, o subespaço estendido de todos os regressores. Portanto, é a projeção em tudo ortogonal ao subespaço estendido por todos os regressores.X H : = I n - HHXM: = In- H
Se , então é singularmente distribuído normal e os elementos são correlacionados, como você declara.X∈ Rn × ke^∈ Rn
Os erros não são observáveis e não são em geral ortogonal ao subespaço gerado por . Por uma questão de argumento, suponha que o erro . Se isso fosse verdade, teríamos com . Como , podemos decompor e obter o verdadeiro .X ε ⊥ extensão ( X ) y = X β + ε = ˜ y + ε ˜ y ⊥ ε ˜ y = X β ∈ extensão ( X ) y εεXε ⊥ span( X)y= Xβ+ ε = y~+ εy~⊥ εy~= Xβ∈ span( X)yε
Suponha que temos uma base de , onde o primeiro vetor base abrange o subespaço e os restantes span . Em geral, o erro terá componentes diferentes de zero para . Esses componentes diferentes de zero serão misturados ao e, portanto, não poderão ser recuperados pela projeção em .R n b 1 , … , b k span ( X ) b k + 1 , … , b n span ( X ) ⊥ ε = α 1 b 1 + … + α n b n α i i ∈ { 1 , ... , k } X βb1 1, … , BnRnb1 1, … , Bkperíodo( X)bk + 1, … , Bnperíodo( X)⊥ε = α1 1b1 1+ … + ΑnbnαEueu ∈ { 1 , … , k }Xβperíodo( X)
Como nunca podemos esperar recuperar os erros verdadeiros e estão correlacionados no singular dimensional normal, poderíamos transformar . Lá podemos ter que
isto é, é não-singular, não correlacionado e homoscedástico, distribuído normalmente. Os resíduos são chamados de resíduos BLUS de Theil .e n e ∈ R n ↦ e * ∈ R n - k e * ~ N N - k ( 0 , σ 2 I n - k ) , e * e *εe^ne^∈ Rn↦ e∗∈ Rn - k
e∗∼ Nn - k( 0 , σ2Eun - k) ,
e∗e∗
No breve artigo Sobre os testes de distúrbios de regressão para normalidade, você encontra uma comparação dos resíduos de OLS e BLUS. Na configuração testada de Monte Carlo, os resíduos de OLS são superiores aos resíduos de BLUS. Mas isso deve lhe dar um ponto de partida.