Estou lendo este artigo sobre a diferença entre Análise de Componentes Principais e Análise Discriminante Múltipla (Análise Discriminante Linear), e estou tentando entender por que você usaria o PCA em vez do MDA / LDA.
A explicação é resumida da seguinte forma:
grosso modo, no PCA, estamos tentando encontrar os eixos com variações máximas em que os dados são mais espalhados (dentro de uma classe, já que o PCA trata todo o conjunto de dados como uma classe) e, no MDA, estamos maximizando adicionalmente o spread entre as classes.
Você não deseja sempre maximizar a variação e maximizar a dispersão entre as classes?