Como o “Teorema Fundamental da Análise Fatorial” se aplica ao PCA, ou como os carregamentos de PCA são definidos?

Atualmente, estou passando por um conjunto de slides que tenho para "análise fatorial" (PCA, tanto quanto eu sei).

Nele, é derivado o "teorema fundamental da análise fatorial", que afirma que a matriz de correlação dos dados que entram na análise ( ) pode ser recuperada usando a matriz de cargas fatoriais ( ): $\bf R$ $\bf A$

R = A A^{⊤}

$\bf R = AA^\top$

Isso, no entanto, me confunde. No PCA, a matriz de "cargas fatoriais" é dada pela matriz de vetores próprios da matriz de covariância / correlação dos dados (já que estamos assumindo que os dados foram padronizados, eles são os mesmos), com cada vetor próprio dimensionado para ter comprimento um. Esta matriz é ortogonal, assim que é, em geral, não é igual a . $\bf AA^\top = I$ $\bf R$

— user2249626
fonte

Além da resposta da @ amoeba, procure na minha resposta adicionando a ambiguidade terminológica. Não recomendo chamar a matriz de vetores próprios A(que são carregamentos), por razões de clareza. A matriz de vetor próprio (do lado direito) geralmente é rotulada V(porque R=USV'por svd), não A. Outro nome equivalente (proveniente da terminologia biplot) para vetores próprios é "coordenadas padrão" e para cargas é "coordenadas principais".

— ttnphns

( "coordenadas padrão" - porque a inércia, ou escala de valores próprios, é a unidade de magnitude quando dotando-os;. "principais coordenadas" - porque é magnitude original quando dotando-os)

— ttnphns

Esta é uma pergunta razoável (+1) que decorre da ambiguidade e confusão terminológicas.

No contexto da APC, as pessoas costumam chamar eixos principais (vetores próprios da matriz de covariância / correlação) de "cargas". Esta é uma terminologia desleixada. O que deveria ser chamado de "loadings" no PCA, são os principais eixos dimensionados pelas raízes quadradas dos respectivos autovalores. Então o teorema a que você está se referindo se manterá.

R = V S V^{⊤}

$\mathbf R = \mathbf V \mathbf S \mathbf V^\top$

V

$\mathbf V$

S

$\mathbf S$

UMA = V S^{1 / 2},

$\mathbf A = \mathbf V \mathbf S^{1/2},$

R = UMA {UMA}^{⊤} .

$\mathbf R = \mathbf A \mathbf A^\top.$

r

$r$

r

$r$

R \approx {UMA}_{r} {UMA}_{r}^{⊤} .

$\mathbf R \approx \mathbf A_r \mathbf A_r^\top.$

Consulte minha resposta aqui para obter mais informações sobre a reconstrução de matrizes de covariância com análise fatorial e cargas de PCA.

— ameba diz Restabelecer Monica
fonte