Eu tenho um classificador no qual estou fazendo validação cruzada, juntamente com mais ou menos cem recursos nos quais estou fazendo a seleção direta para encontrar combinações ideais de recursos. Também comparo isso com a execução dos mesmos experimentos com o PCA, onde utilizo os recursos em potencial, aplico SVD, transformo os sinais originais no novo espaço de coordenadas e utilizo os principais recursos do no meu processo de seleção direta.
Minha intuição era que o PCA melhoraria os resultados, pois os sinais seriam mais "informativos" do que os recursos originais. Minha compreensão ingênua do PCA está me levando a problemas? Alguém pode sugerir alguns dos motivos mais comuns pelos quais o PCA pode melhorar os resultados em algumas situações, mas piorá-los em outras?