Eu tenho um conjunto de dados nominalmente 16-dimensional. Eu tenho cerca de 100 amostras em um caso e cerca de 20.000 em outro. Com base em várias análises exploratórias que conduzi usando PCA e mapas de calor, estou convencido de que a verdadeira dimensionalidade (ou seja, o número de dimensões necessárias para capturar a maior parte do "sinal") é de cerca de 4. Quero criar um slide para esse efeito para uma apresentação. A "sabedoria convencional" sobre esses dados, que pretendo refutar, é que a verdadeira dimensionalidade é uma ou duas.
O que é uma visualização simples e boa para mostrar a verdadeira dimensionalidade de um conjunto de dados? De preferência, deve ser compreensível para pessoas que possuem alguma experiência em estatística, mas não são estatísticos "reais".