Quero reduzir a dimensionalidade dos sistemas de ordem superior e capturar a maior parte da covariância em um campo de preferência bidimensional ou unidimensional. Entendo que isso pode ser feito por meio da análise de componentes principais e usei o PCA em muitos cenários. No entanto, nunca o usei com tipos de dados booleanos e fiquei pensando se é significativo fazer o PCA com esse conjunto. Por exemplo, finja que tenho métricas qualitativas ou descritivas e atribua um "1" se essa métrica for válida para essa dimensão e "0" se não for (dados binários). Por exemplo, finja que você está tentando comparar os Sete Anões em Branca de Neve. Nós temos:
Doc, Dunga, Bashful, Grumpy, Sneezy, Sleepy and Happy, e você deseja organizá-los com base nas qualidades, e fez o seguinte:
Assim, por exemplo, Bashful é intolerante à lactose e não faz parte do papel de honra A. Esta é uma matriz puramente hipotética, e minha matriz real terá muito mais colunas descritivas. Minha pergunta é: ainda seria apropriado fazer o APC nessa matriz como meio de encontrar a semelhança entre os indivíduos?
a means of finding the similarity between individuals
. Mas essa tarefa é para uma análise de cluster, não para PCA.