Am×nm≥nvAv1=argmaxv∈Rn∥Av∥2subject to ∥v∥2=1.(1)
v1Av2=argmaxv∈Rn∥Av∥2subject to ⟨v1,v⟩=0,∥v∥2=1.
v1,…,vnRnRnA
Seja (então quantifica a potência explosiva de na direção ). Suponha que os vetores unitários sejam definidos de forma que
As equações (2) podem ser expressas de forma concisa usando a notação da matriz como
onde é a matriz cuja coluna é , é a matriz cuja a coluna é eσi=∥Avi∥2σiAviuiAvi=σiuifor i=1,…,n.(2)
AV=UΣ,(3)
Vn×niviUm×niuiΣé o matriz diagonal cuja th entrada diagonal é . A matriz é ortogonal, então podemos multiplicar os dois lados de (3) por para obter
Pode parecer que agora derivamos o SVD de com quase zero esforço. Até agora, nenhuma das etapas foi difícil. No entanto, falta uma parte crucial da imagem - ainda não sabemos que é ortogonal.n×niσiVVTA=UΣVT.
AU
Aqui está o fato crucial, a peça que faltava: acontece que é ortogonal a :
Eu afirmo que se isso não fosse verdade, então não seria o ideal para o problema (1). De fato, se (4) não fosse satisfeito, seria possível melhorar perturbando-o um pouco na direção .Av1Av2⟨Av1,Av2⟩=0.(4)
v1 v1v2
Suponha (por uma contradição) que (4) não seja satisfeito. Se estiver ligeiramente perturbado na direção ortogonal , a norma de não será alterada (ou, pelo menos, a alteração na norma de será desprezível). Quando eu ando na superfície da terra, minha distância do centro da terra não muda. No entanto, quando é perturbado na direção , o vetor é perturbado na direção não ortogonal e, portanto, a alteração na norma de não é desprezível . A norma dev1v2v1v1v1v2Av1Av2Av1Av1pode ser aumentado em uma quantidade não desprezível. Isso significa que não é ideal para o problema (1), que é uma contradição. Adoro esse argumento porque: 1) a intuição é muito clara; 2) a intuição pode ser convertida diretamente em uma prova rigorosa.v1
Um argumento semelhante mostra que é ortogonal a e e assim por diante. Os vetores são ortogonais aos pares. Isso significa que os vetores unitários podem ser escolhidos para serem ortogonais em pares, o que significa que a matriz acima é uma matriz ortogonal. Isso completa nossa descoberta do SVD.Av3Av1Av2Av1,…,Avnu1,…,unU
Para converter o argumento intuitivo acima em uma prova rigorosa, devemos confrontar o fato de que se é perturbado na direção , o vetor perturbado
não é verdadeiramente um vetor unitário. (Sua norma é .) Para obter uma prova rigorosa, defina
O vetor é realmente um vetor de unidade. Mas, como você pode mostrar facilmente, se (4) não for satisfeito, então, para valores suficientemente pequenos de , temos
(assumindo que o sinal dev1v2v~1=v1+ϵv2
1+ϵ2−−−−−√v¯1(ϵ)=1−ϵ2−−−−−√v1+ϵv2.
v¯1(ϵ)ϵf(ϵ)=∥Av¯1(ϵ)∥22>∥Av1∥22
ϵé escolhido corretamente). Para mostrar isso, basta verificar se . Isso significa que não é ideal para o problema (1), que é uma contradição.f′(0)≠0v1
(A propósito, eu recomendo a leitura da explicação de Qiaochu Yuan sobre o SVD aqui . Em particular, dê uma olhada no "Lema principal nº 1", que é o que discutimos acima. Como diz Qiaochu, o principal lema nº 1 é "o coração técnico de decomposição de valor singular ".)