O PCA robusto (desenvolvido por Candes et al 2009 ou melhor ainda por Netrepalli et al 2014 ) é um método popular para detecção multivariada de outlier , mas a distância de Mahalanobis também pode ser usada para detecção de outlier, dada uma estimativa robusta e regularizada da matriz de covariância . Estou curioso sobre as (des) vantagens de usar um método sobre o outro.
Minha intuição me diz que a maior distinção entre os dois é a seguinte: Quando o conjunto de dados é "pequeno" (no sentido estatístico), o PCA robusto fornecerá uma covariância de nível inferior, enquanto a estimativa robusta da matriz de covariância fornecerá uma descrição completa. covariância de classificação devido à regularização de Ledoit-Wolf. Como isso afeta a detecção de outlier?