Considere o que o PCA faz. Simplificando, o PCA (como normalmente é executado) cria um novo sistema de coordenadas ao:
- mudar a origem para o centróide dos seus dados,
- aperta e / ou estica os eixos para torná-los iguais em comprimento, e
- gira seus eixos para uma nova orientação.
(Para obter mais detalhes, consulte este excelente tópico do CV: Compreendendo a análise de componentes principais, os autovetores e os autovalores .) No entanto, ele não apenas gira seus eixos da maneira antiga. Seu novo (o primeiro componente principal) é orientado na direção da variação máxima de seus dados. O segundo componente principal é orientado na direção da próxima maior quantidade de variação ortogonal ao primeiro componente principal . Os demais componentes principais são formados da mesma forma. X1
Com isso em mente, vamos examinar o exemplo de @ amoeba . Aqui está uma matriz de dados com dois pontos em um espaço tridimensional:
Vamos ver esses pontos em um gráfico de dispersão tridimensional (pseudo):
X=[121212]
(1.5,1.5,1.5)(0,0,0)(3,3,3)(0,0,3)(3,3,0)(0,3,0)(3,0,3)
N=2N−1=1