Estou ensinando álgebra linear a uma classe de engenheiros, cientistas sociais e programadores de computador. Acabamos de decompor o valor singular e temos um dia extra, então pensei em falar sobre a relação entre a decomposição do valor singular e a análise de componentes principais. Tenho a parte teórica da palestra escrita muito bem, mas estou com dificuldade para encontrar bons exemplos para usar. Aqui estão as restrições:
Eu quero mostrar fotos. Idealmente, os gráficos devem funcionar bem sozinhos: os eixos e os pontos de dados no gráfico de dispersão devem ser rotulados. As palavras em inglês são melhores que os nomes de espécies latinas.
A questão que está sendo estudada deve ser interessante. A morfologia dos peixes nigerianos, embora importante, não é uma boa maneira de atrair a atenção de uma classe.
Em contraste com o ponto anterior: Nada sobre diferenças raciais humanas; nada em testes de inteligência. Isso levaria a uma discussão animada que nada teria a ver com as técnicas matemáticas.
O método de análise matemática deve ser basicamente PCA puro. O projeto DW-NOMINATE, embora incrível, usa o PCA como ponto de partida, seguido por um algoritmo de escalada em montanhas muito mais complicado.
Eu acho que isso seria fácil. Posso facilmente pensar em uma dúzia de projetos divertidos de análise que eu poderia fazer se tivesse tempo para reunir os dados: faça as pesquisas da Pew Research e veja se o PCA recupera o eixo da política social / política fiscal amado pelos libertários. Faça uma dúzia de medições de características físicas típicas de raças de cães e veja se o PCA pode encontrar o cluster "cão pastor". Etcetera, etcetera ... Estou procurando alguém que já tenha feito o trabalho para que eu possa exibi-lo.
Receio que a linha do tempo aqui seja bastante estreita: eu dou uma palestra amanhã à tarde (segunda-feira). Passei a maior parte do fim de semana pesquisando estudos sobre PCA em diferentes campos interessantes e descobrindo repetidamente que eles não são bons.