Eu tenho trabalhado em um novo método para analisar e analisar conjuntos de dados para identificar e isolar subgrupos de uma população sem conhecer as características de nenhum subgrupo. Embora o método funcione bem o suficiente com amostras de dados artificiais (ou seja, conjuntos de dados criados especificamente com o objetivo de identificar e segregar subconjuntos da população), eu gostaria de tentar testá-lo com dados ao vivo.
O que estou procurando é uma fonte de dados disponível gratuitamente (ou seja, não confidencial, não proprietária). De preferência, uma contendo distribuições bimodais ou multimodais ou obviamente composta de vários subconjuntos que não podem ser facilmente separados por meios tradicionais. Onde eu iria encontrar essas informações?