Como a asserção na citação é uma coleção de instruções sobre como redimensionar as colunas de , você também pode provar todas de uma vez. De fato, não é preciso mais trabalho para provar uma generalização da afirmação:X
Quando é multiplicado à direita por uma matriz invertível , a nova estimativa de coeficiente é igual a multiplicado à esquerda por .Um β Um β Um - 1XUMAβ^UMAβ^UMA- 1
Os únicos fatos algébricos que você precisa são os (facilmente comprovados e bem conhecidos) que para qualquer matriz e para matrizes inversíveis e . (Uma versão mais sutil desta última é necessária ao trabalhar com inversos generalizados: para e invertíveis e qualquer , . ) A B ( A B ) - 1 = B - 1 A - 1 A B A B X ( A X B ) - = B - 1 X - A - 1( A B )′= B′UMA′A B( A B )- 1= B- 1UMA- 1UMABUMABX( A XB )-= B- 1X-UMA- 1
Prova de álgebra :
β^UMA= ( ( XA )′( ( XA ) )-( XA )′y= A- 1( X′X)-( A′)- 1UMA′y= A- 1β^,
QED. (Para que essa prova seja totalmente geral, o sobrescrito refere-se a um inverso generalizado.)-
Prova por geometria :
Bases dadas e de e , respectivamente, representa uma transformação linear de a . A multiplicação correta de por pode ser considerada como deixando essa transformação fixa, mas alterando para (ou seja, para as colunas de ). Sob essa mudança de base, a representação de qualquer vetor deve ser alterada por multiplicação à esquerda por ,E N R N R p X R p R N X A E p A E p Um p ∈ R p Um - 1EpEnRnRpXRpRnXUMAEpA EpUMAβ^∈ RpUMA- 1QED .
(Essa prova funciona, sem modificação, mesmo quando não é invertível.)X′X
A cotação refere-se especificamente ao caso das matrizes diagonais com para e .A i i = 1 i ≠ j A j j = cUMAUMAeu eu= 1i ≠ jUMAj j= c
Conexão com mínimos quadrados
O objetivo aqui é usar os primeiros princípios para obter o resultado, sendo o princípio dos mínimos quadrados: estimar coeficientes que minimizam a soma dos quadrados dos resíduos.
Novamente, provar uma generalização (enorme) não prova mais difícil e é bastante revelador. Suponha que seja qualquer mapa (linear ou não) de espaços vetoriais reais e suponha que seja qualquer função com valor real em . Seja o (possivelmente vazio) conjunto de pontos para o qual é minimizado. Q W n U ⊂ V p v Q ( ϕ ( v ) )
ϕ : Vp→ Wn
QWnvocê⊂ VpvQ ( ϕ ( v ) )
Resultado: , que é determinado apenas por e , não depende de nenhuma escolha de base usada para representar vetores em .Q ϕ E p V pvocêQϕEpVp
Prova: QED.
Não há nada a provar!
Aplicação do resultado: Seja uma forma quadrática semidefinida positiva em , e suponha que seja um mapa linear representado por quando bases de e são escolhidos. Defina . Escolha uma base de e suponha que é a representação de algum nessa base. Isso é o mínimo de quadrados : minimiza a distância ao quadrado . PorqueR N y ∈ R n φ X V p = R P W n = R n Q ( x ) = M ( y , x ) R p β v ∈ L X = X β F ( y , x ) X R p X Um β Um - 1FRny∈ RnϕXVp= RpWn= RnQ ( x ) = F( y, X )Rpβ^v ∈ Ux = Xβ^F( y, X )Xé um mapa linear, alterando a base de corresponde a direita multiplicando- por uma matriz invertível . Isso será multiplicado à esquerda por , QED .RpXUMAβ^UMA- 1