Uma coisa comum a se fazer ao fazer a Análise de Componentes Principais (PCA) é plotar duas cargas uma contra a outra para investigar os relacionamentos entre as variáveis. No artigo que acompanha o pacote PLS R para fazer a regressão de componentes principais e a regressão PLS, há um gráfico diferente, chamado gráfico de cargas de correlação (consulte a figura 7 e a página 15 no artigo). A carga de correlação , como é explicado, é a correlação entre as pontuações (do PCA ou PLS) e os dados reais observados.
Parece-me que os carregamentos e os carregamentos de correlação são bastante semelhantes, exceto que eles são dimensionados de maneira um pouco diferente. Um exemplo reproduzível em R, com o mtcars do conjunto de dados incorporado, é o seguinte:
data(mtcars)
pca <- prcomp(mtcars, center=TRUE, scale=TRUE)
#loading plot
plot(pca$rotation[,1], pca$rotation[,2],
xlim=c(-1,1), ylim=c(-1,1),
main='Loadings for PC1 vs. PC2')
#correlation loading plot
correlationloadings <- cor(mtcars, pca$x)
plot(correlationloadings[,1], correlationloadings[,2],
xlim=c(-1,1), ylim=c(-1,1),
main='Correlation Loadings for PC1 vs. PC2')
Qual é a diferença na interpretação dessas parcelas? E qual trama (se houver) é melhor usar na prática?