Publiquei recentemente um conjunto de dados ( link ) com 369 classes. Fiz algumas experiências com eles para ter uma idéia de quão difícil é a tarefa de classificação. Normalmente, eu gosto se houver matrizes de confusão para ver o tipo de erro que está sendo cometido. No entanto, um matriz não é prático.
Existe uma maneira de fornecer informações importantes de grandes matrizes de confusão? Por exemplo, geralmente existem muitos 0s que não são tão interessantes. É possível classificar as classes para que a maioria das entradas diferentes de zero fique na diagonal para permitir a exibição de várias matrizes que fazem parte da matriz de confusão completa?
Aqui está um exemplo para uma grande matriz de confusão .
Exemplos em estado selvagem
A Figura 6 do EMNIST parece legal:
É fácil ver onde estão muitos casos. No entanto, essas são apenas classes. Se a página inteira fosse usada em vez de apenas uma coluna, isso provavelmente poderia ser três vezes maior, mas ainda seriam apenas 3 × 26 = 78 classes. Nem mesmo perto de 369 classes de HASY ou 1000 de ImageNet.
Veja também
Minha pergunta semelhante no CS.stackexchange