Quais são os conjuntos de dados disponíveis gratuitamente para classificação com mais de 1000 recursos (ou pontos de amostra, se contiverem curvas)?
Já existe um wiki da comunidade sobre conjuntos de dados gratuitos: Localizando amostras de dados disponíveis gratuitamente
Mas aqui, seria bom ter uma lista mais focada que possa ser usada de forma mais conveniente , também proponho as seguintes regras:
- Uma postagem por conjunto de dados
- Nenhum link para o conjunto de dados
cada conjunto de dados deve estar associado a
um nome (para descobrir do que se trata) e um link para o conjunto de dados (os conjuntos de dados R podem ser nomeados com o nome do pacote)
o número de recursos (digamos que seja p ), o tamanho do conjunto de dados (digamos que seja n ) e o número de rótulos / classe (digamos que seja k )
uma taxa de erro típica da sua experiência (indique o algoritmo usado em palavras) ou da literatura (neste último caso, vincule o artigo)