Estou trabalhando na criação de um site, que exibe os dados do censo de um usuário selecionado Polygons e gostaria de mostrar graficamente a distribuição de vários parâmetros (um gráfico por parâmetro).
Os dados geralmente têm as seguintes propriedades:
- O tamanho da amostra tende a ser grande (digamos, cerca de 10.000 pontos de dados)
- O intervalo de valores tende a ser muito grande (por exemplo, a população mínima pode ser menor que 100 e o máximo pode ser algo como 500.000)
- q1 geralmente está próximo do mínimo (digamos 200), enquanto q2 e q3 estarão dentro de 10.000
- Não parece nada com uma distribuição normal
Eu não sou um estatístico e, portanto, minha descrição pode não ser exatamente clara.
Eu gostaria de mostrar essa distribuição em um gráfico, que será visto pelos cidadãos (o leigo, se você preferir).
Eu preferiria usar um histograma, mas isso não é possível devido à grande variedade de valores, devido aos quais fazer caixas não é realmente fácil e direto.
Pelo pouco que sei sobre estatísticas, um gráfico de caixa é o que é frequentemente usado para mostrar esse tipo de dados, mas acho que para um leigo decifrar o gráfico de caixa não é fácil.
Quais são minhas opções para mostrar esses dados de uma maneira fácil de entender?