Antecedentes: perguntei a centenas de participantes da minha pesquisa quanto eles estavam interessados em áreas selecionadas (em escalas Likert de cinco pontos, sendo 1 indicando "não interessado" e 5 indicando "interessado").
Então eu tentei o PCA. A figura abaixo é uma projeção dos dois primeiros componentes principais. As cores são usadas para os sexos e as setas do PCA são variáveis originais (ou seja, interesses).
Eu percebi isso:
- Os pontos (respondentes) são muito bem separados pelo segundo componente.
- Não há pontos de seta restantes.
- Algumas flechas são muito mais curtas que outras.
- Variáveis tendem a criar agrupamentos, mas não observações.
- Parece que as setas apontando para baixo (para homens) são principalmente interesses masculinos e as setas para cima são principalmente interesses femininos.
- Algumas setas não apontam para baixo nem para cima.
Perguntas: Como interpretar corretamente as relações entre pontos (respondentes), cores (sexos) e setas (variáveis)? Que outras conclusões sobre os entrevistados e seus interesses podem ser extraídas dessa trama?
Os dados podem ser encontrados aqui .