Parece-me que a principal função do PCP é destacar grupos homogêneos de indivíduos ou, inversamente (no espaço duplo, por analogia com o PCA), padrões específicos de associação em diferentes variáveis. Ele produz um resumo gráfico eficaz de um conjunto de dados multivariado, quando não há muitas variáveis. As variáveis são dimensionadas automaticamente para um intervalo fixo (normalmente de 0 a 1), o que equivale a trabalhar com variáveis padronizadas (para impedir a influência de uma variável nas outras devido a um problema de dimensionamento), mas para um conjunto de dados de alta dimensão (# das variáveis> 10), você definitivamente precisa olhar para outras telas, como gráfico de flutuação ou mapa de calor, conforme usado em estudos de microarranjos.
Ajuda a responder perguntas como:
- existe algum padrão consistente de pontuações individuais que possa ser explicado pela participação específica na turma (por exemplo, diferença de gênero)?
- X1X2
No gráfico a seguir dos dados da íris , é claramente visto que as espécies (mostradas aqui em cores diferentes) mostram perfis muito discriminantes ao considerar o comprimento e a largura da pétala, ou que a íris setosa (azul) é mais homogênea em relação ao comprimento da pétala ( ou seja, sua variação é menor), por exemplo.
Você pode até usá-lo como um back-end para técnicas de classificação ou redução de dimensão, como o PCA. Na maioria das vezes, ao executar um PCA, além de reduzir o espaço de recursos, você também deseja destacar grupos de indivíduos (por exemplo, existem indivíduos que pontuam sistematicamente mais alto em alguma combinação das variáveis); isso geralmente ocorre, aplicando algum tipo de cluster hierárquico nas pontuações dos fatores e destacando a associação do cluster resultante no espaço fatorial (consulte o pacote FactoClass R).
Também é usado em clustergrams ( visualização de análises não hierárquicas e hierárquicas de cluster ), que visa examinar como a alocação de cluster evolui ao aumentar o número de clusters (consulte também: Quais critérios de parada para clustering hierárquico aglomerativo são usados na prática? ).
Essas exibições também são úteis quando vinculadas a gráficos de dispersão usuais (que por construção são restritos a relacionamentos 2D), isso é chamado de escovação e está disponível no sistema de visualização de dados GGobi ou no software Mondrian .