O algoritmo PCA pode ser formulado em termos da matriz de correlação (suponha que os dados já tenham sido normalizados e estamos considerando apenas a projeção no primeiro PC). A função objetivo pode ser escrita como:
Isso é bom e usamos multiplicadores lagrangianos para resolvê-lo, ou seja, reescrevendo-o como:
que é equivalente a
e, portanto, ( veja aqui no Mathworld ) parece ser igual a
Mas isso significa maximizar a distância entre ponto e linha e, pelo que li aqui , isso está incorreto - deve ser , não . Onde está o meu erro?
Ou alguém pode me mostrar o elo entre maximizar a variação no espaço projetado e minimizar a distância entre ponto e linha?