Por que o PCA é sensível a valores discrepantes?


26

Existem muitos posts neste SE que discutem abordagens robustas para a análise de componentes principais (PCA), mas não consigo encontrar uma única boa explicação de por que o PCA é sensível a discrepâncias em primeiro lugar.


5
Porque a contribuição da norma L2 é muito alta para discrepantes. Então, ao minimizar a norma L2 (que é o que o PCA tenta fazer), esses pontos serão mais difíceis de ajustar do que os pontos mais próximos da vontade média.
mathreadler

Respostas:


35

L2YmnXkn

YXAF2=j=1mYjXAj.2
AF

Como o PCA minimiza as normas (ou seja, normas quadráticas), ele tem os mesmos problemas de mínimos quadrados ou é adequado a um gaussiano por ser sensível a valores extremos. Por causa da quadratura dos desvios dos valores discrepantes, eles dominam a norma total e, portanto, acionam os componentes do PCA. L2

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.