Eu sei que o objetivo do PCA é reduzir a dimensionalidade
Isso geralmente é o que as pessoas assumem, mas, na verdade, o PCA é apenas uma representação dos seus dados em uma base ortogonal. Essa base ainda tem a mesma dimensionalidade que seus dados originais. Nada está perdido ... ainda. A parte de redução de dimensionalidade é totalmente sua. O que o PCA garante é que as dimensões superiores de sua nova projeção sejam as melhores dimensões em que seus dados possam ser representados. O que significa melhor? É aí que entra a variação explicada.k k
obviamente não neste caso
Eu não teria tanta certeza disso! No seu segundo gráfico, visualmente, parece que muitas informações dos seus dados podem ser projetadas em uma linha horizontal. Essa é uma dimensão, em vez da plotagem original, que estava em duas dimensões! Obviamente, você perde algumas informações porque está removendo o eixo Y, mas a decisão é aceitável para você.
Há uma série de perguntas relacionadas ao que o PCA está no site, por isso encorajo você a consultá-las aqui , aqui , aqui ou aqui . Se você tiver outras perguntas depois disso, poste-as e ficarei feliz em ajudar.
Como sua pergunta real:
qual é a história que você pode contar sobre temperatura versus sorvete na trama do PCA?
Como os novos eixos de coordenadas são uma combinação linear das coordenadas originais, então ... basicamente nada! O PCA fornecerá uma resposta como (números compostos):
P C 1P C 2= 2,5 × sorvete - 3,6 × temperatura= - 1,5 × sorvete + 0,6 × temperatura
Isso é útil para você? Talvez. Mas acho que não :)
Editado
Vou adicionar esse recurso que acho útil porque os gráficos interativos são legais.
Editado novamente
k
n > kkk k