Se o PCA esparso é mais fácil de interpretar do que o PCA padrão ou não, depende do conjunto de dados que você está investigando. Aqui está como eu penso sobre isso: às vezes alguém está mais interessado nas projeções do PCA (representação de baixa dimensão dos dados), e às vezes - nos eixos principais; é apenas neste último caso que a PCA esparsa pode trazer benefícios para a interpretação. Deixe-me dar alguns exemplos.
Por exemplo, estou trabalhando com dados neurais (gravações simultâneas de muitos neurônios) e aplicando PCA e / ou técnicas de redução de dimensionalidade relacionadas para obter uma representação em baixa dimensão da atividade da população neural. Eu posso ter 1000 neurônios (ou seja, meus dados vivem no espaço 1000-dimensional) e quero projetá-los nos três principais eixos principais. O que são esses eixos é totalmente irrelevante para mim e não tenho nenhuma intenção de "interpretar" esses eixos de forma alguma. O que me interessa é a projeção em 3D (como a atividade depende do tempo, tenho uma trajetória nesse espaço em 3D). Então, eu estou bem se cada eixo tiver todos os 1000 coeficientes diferentes de zero.
Por outro lado, alguém pode estar trabalhando com dados mais "tangíveis", onde as dimensões individuais têm um significado óbvio (ao contrário dos neurônios individuais acima). Por exemplo, um conjunto de dados de vários carros, em que as dimensões variam de peso a preço. Nesse caso, pode-se realmente interessar nos eixos principais principais, porque pode-se dizer algo: veja, o 1º eixo principal corresponde à "fantasia" do carro (estou inventando isso agora). Se a projeção for esparsa, essas interpretações geralmente seriam mais fáceis de serem feitas, porque muitas variáveis terão coeficientes e, portanto, são obviamente irrelevantes para esse eixo em particular. No caso do PCA padrão, geralmente se obtém coeficientes diferentes de zero para todas as variáveis.0 0
Você pode encontrar mais exemplos e alguma discussão sobre este último caso no artigo Sparse PCA de 2006, de Zou et al. A diferença entre o primeiro e o último caso, no entanto, não vi explicitamente discutido em nenhum lugar (mesmo que provavelmente tenha sido).