Para executar a análise de componentes principais (PCA), é necessário subtrair os dados de cada coluna, calcular a matriz do coeficiente de correlação e, em seguida, localizar os vetores próprios e os valores próprios. Bem, pelo contrário, foi o que fiz para implementá-lo no Python, exceto que funciona apenas com matrizes pequenas, porque o método para encontrar a matriz do coeficiente de correlação (corrcoef) não me permite usar uma matriz com alta dimensionalidade. Desde que eu tenho que usá-lo para imagens, minha implementação atual realmente não me ajuda.
Eu li que é possível apenas pegar sua matriz de dados e calcular vez de , mas isso não funciona para mim. Bem, não sei exatamente se entendi o que isso significa, além do fato de ser uma matriz vez de (no meu caso, ). Eu li sobre os tutoriais de autofaces, mas nenhum deles parecia explicar isso de uma maneira que eu realmente conseguia entender.D D ⊤ / n D ⊤ D / n n × n p × p p ≫ n
Em resumo, existe uma descrição algorítmica simples desse método para que eu possa segui-lo?