Estou com dificuldades para selecionar a maneira correta de visualizar dados. Digamos que temos livrarias que vendem livros , e todo livro tem pelo menos uma categoria .
Para uma livraria, se contarmos todas as categorias de livros, adquirimos um histograma que mostra o número de livros que se enquadram em uma categoria específica para essa livraria.
Quero visualizar o comportamento da livraria, quero ver se eles favorecem uma categoria em detrimento de outras categorias. Não quero ver se eles estão favorecendo a ficção científica todos juntos, mas quero ver se estão tratando todas as categorias igualmente ou não.
Eu tenho ~ 1 milhão de livrarias.
Eu pensei em 4 métodos:
Prove os dados, mostre apenas 500 histogramas da livraria. Mostre-os em 5 páginas separadas usando a grade 10x10. Exemplo de uma grade 4x4:
Igual ao nº 1. Porém, desta vez, classifique os valores do eixo x de acordo com a contagem decrescente; portanto, se houver um favor, ele será visto facilmente.
Imagine juntar os histogramas no 2 como um baralho e mostrá-los em 3D. Algo assim:
Em vez de usar o terceiro eixo processando cores para representar cores, use um mapa de calor (histograma 2D):
se geralmente as livrarias preferem algumas categorias a outras, ele será exibido como um bom gradiente da esquerda para a direita.
Você tem outras idéias / ferramentas de visualização para representar vários histogramas?