Atualmente, estou passando por um conjunto de slides que tenho para "análise fatorial" (PCA, tanto quanto eu sei).
Nele, é derivado o "teorema fundamental da análise fatorial", que afirma que a matriz de correlação dos dados que entram na análise ( ) pode ser recuperada usando a matriz de cargas fatoriais ( A ):
Isso, no entanto, me confunde. No PCA, a matriz de "cargas fatoriais" é dada pela matriz de vetores próprios da matriz de covariância / correlação dos dados (já que estamos assumindo que os dados foram padronizados, eles são os mesmos), com cada vetor próprio dimensionado para ter comprimento um. Esta matriz é ortogonal, assim que é, em geral, não é igual a R .
A
(que são carregamentos), por razões de clareza. A matriz de vetor próprio (do lado direito) geralmente é rotuladaV
(porqueR=USV'
por svd), nãoA
. Outro nome equivalente (proveniente da terminologia biplot) para vetores próprios é "coordenadas padrão" e para cargas é "coordenadas principais".