Quais são as regras essenciais para projetar e produzir parcelas?

19

Fundo:

Anteriormente em Cross Validated, tivemos perguntas sobre:

Foi sugerido por @david nos comentários a esta pergunta que deveríamos ter uma pergunta do wiki da comunidade com uma regra de visualização por resposta na qual a comunidade pudesse votar.

Questão

Quais são as regras essenciais para projetar e produzir representações gráficas de dados?

Regras

Uma regra por resposta
Idealmente, inclua uma breve explicação de por que você acha que é uma boa ideia
Respostas com exemplos (código e imagem) de boas e más práticas preferidas.

data-visualization

— Jeromy Anglim
fonte

13

Substância sobre a forma : escolha o gráfico, estilo, cor ou outros parâmetros gráficos adequados para mostrar o que você deseja que o gráfico mostre, em vez do que o pacote de gráficos necessariamente permite.

— Fomite
fonte

8

(+1) Em geral, prefiro esboçar um gráfico no papel para reduzir a chance de minhas decisões de projeto serem guiadas pelo caminho de menor resistência criado pelo software gráfico.

— precisa saber é o seguinte

13

Estar familiarizado com as três dimensões da cor pode ser útil. Se você usar várias cores, elas deverão diferir idealmente em várias dessas dimensões, não em apenas uma.

Valor. O gráfico deve permanecer legível, mesmo em preto e branco. Esta regra simples deve levar em consideração o daltonismo, as impressoras de baixa qualidade e as más condições de iluminação. Mesmo se você usar tons diferentes, verifique se os valores são suficientemente diferentes. Em particular, as plotagens devem estar escuras em um fundo claro (ou o oposto), mas não cinza em um valor cinza. O pior exemplo seria um gráfico azul de fundo vermelho - ambos são valores médios, ou seja, dariam cinzas muito semelhantes após a conversão em preto e branco.

Saturação. A saturação deve ser usada com moderação: uma linha vermelha pura pode ser fina, mas uma linha vermelha mais espessa e menos saturada será mais legível (a espessura aumentada ajuda a distinguir cores e permite reduzir a saturação). Por outro lado, uma área vermelha pura é dolorosa de se olhar: não use cores saturadas para preencher áreas. As paletas de cores do Brewer (projetadas para mapas, não para linhas) fornecem exemplos de opções de cores de baixa saturação. O pior exemplo seria, novamente, um fundo saturado (azul em vermelho ou vermelho em azul).

Matiz. Como mencionado por @gung, evite a combinação de vermelho / verde (semáforo): há muito mais pessoas daltônicas do que você imagina. Especialmente com matiz, menos é mais. Por exemplo, para plotar valores "divergentes" (ou seja, quantidades que podem ser positivas ou negativas), use apenas duas cores (para valores positivos e negativos), para que o leitor possa distinguir imediatamente o que é alto e o que é baixo. Usar um gradiente discreto pode resultar em um gráfico muito mais legível: os limites entre as cores se tornam visíveis e formam um gráfico de contorno.

Você pode ler as Regras práticas de S. Few para o uso de cores em gráficos ou consultar qualquer material sobre "Teoria das cores" para estudantes de arte ou design.

— Vincent Zoonekynd
fonte

+1, boas informações aqui. Seu ponto de vista sobre valor e como as cores serão renderizadas após a conversão em preto e branco é particularmente bom. O link para o documento Poucos também é útil. Uma observação: é melhor não se referir a outras respostas como "acima", use @ so-and-so; as respostas se movem com base em quantos votos eles recebem.

— gung - Restabelece Monica

11

Coloque o máximo de informações necessárias dentro da própria figura. Não exija que o leitor faça referência à legenda, por exemplo, para identificar o significado de vários símbolos ou cores. Coloque qualquer informação (ou informação suplementar) que não possa entrar na própria figura na legenda. A idéia é minimizar o esforço exigido por um visualizador de gráfico para extrair as informações relevantes - melhor: o gráfico é autoexplicativo, o próximo melhor: as informações suplementares necessárias podem ser rapidamente obtidas da legenda, o pior: o espectador deve ler atentamente as seção de resultados completos, procurando por alguns detalhes cruciais para descobrir o que está acontecendo.

— David
fonte

1

+1 e podemos estender ainda mais essa idéia: queremos que as pessoas vejam um gráfico e saibam (o máximo possível) o que está acontecendo sem precisar ler a legenda e também quando precisam de informações adicionais para tenha isso disponível na legenda para que as pessoas possam ler a legenda e saber o que precisam sem ter que ler o artigo procurando aquele detalhe crucial.

— gung - Restabelece Monica

1

@gung como esta é a CW, fique à vontade para editar a resposta para refletir seus comentários.

— David LeBauer

10

Faça o enredo o mais simples possível. Nas palavras de Tufte, 'minimize a proporção entre dados e tinta'.

Por exemplo, evite:

mais cores ou formas do que o necessário
mais marcas do que o necessário
Efeitos 3D em um gráfico 2D.
usando uma legenda quando os objetos podem ser rotulados diretamente

— David LeBauer
fonte

Eu discordo de Tufte aqui. Primeiro, grande parte da motivação para essa regra em seu livro original é quanto tempo você gasta desenhando linhas extras e desnecessárias; mas isso é irrelevante hoje. Segundo, a idéia real é melhor capturada pela regra de Cleveland para maximizar a informatividade do gráfico, pois às vezes o enredo pode se tornar mais informativo com mais tinta, mas ambas as regras proíbem o setor de gráficos que ofende o Tufte.

— gung - Restabelece Monica

@gung, onde foi o esforço / tempo necessário apresentado como motivação pela Tufte. Não me recordo dessa parte (mas também não tenho o texto à mão).

— David LeBauer

1

Também não o tenho, mas em seu primeiro livro Visual Display , lembro-me dele falando sobre quantas vezes você teve que largar a régua para desenhar um gráfico. Talvez "grande" fosse um exagero, mas lembro-me de ler isso e pensar: 'quem se importa com isso agora?' Em Elements , Cleveland argumenta convincentemente que a regra de Tufte está errada. Ele argumenta que o objetivo é maximizar a transferência de informações e mostra que esse princípio também elimina o que o Tufte não gosta, mas permite casos (o que ele mostra) em que a tinta extra que não é de dados ajuda a tornar o gráfico mais informativo.

— gung - Restabelece Monica

Devo esclarecer, não discordo de algumas sugestões específicas (por exemplo, sem 3D, sem gráfico); Estou discutindo com a regra de Tufte como orientação para gráficos.

— gung - Restabelece Monica

@gung Interpretei a mesma discussão que uma ferramenta heurística - uma maneira fácil para o leitor entender a abordagem, em vez de uma maneira de reduzir o trabalho do designer.

— David LeBauer

9

Deixe tempo para editar. Criar um bom gráfico leva tempo e geralmente leva (pelo menos para mim) várias tentativas.

— Peter Flom - Restabelecer Monica
fonte

6

Não se oponha a vermelho e verde. A cor pode ser útil, mas ao usar cores, lembre-se de que uma minoria substancial de pessoas é daltônica em verde-vermelho. Certa vez, eu estava mostrando alguns dados para alguém, e ele não conseguiu entender o que estava acontecendo nos meus gráficos - era um desperdício e me senti muito estúpido. Outras formas de daltonismo são muito raras, mas verde-vermelho é bastante comum. Esta página possui muitas informações boas. Aqui estão algumas dicas:

Se você precisar apenas de duas cores, use azul e amarelo - não use vermelho e verde.
Se você precisar de um gradiente, vá de azul para amarelo enquanto altera a saturação e a luminosidade simultaneamente - não use o arco-íris.
Se você precisar codificar mais de dois elementos (por exemplo, pontos em um gráfico de dispersão de mais de dois grupos ou várias linhas), faça backup de suas cores com símbolos de plotagem / estilos de linha diferentes. Por exemplo, símbolos distintos de plotagem: o + <sw, ou linhas: sólidas, pontilhadas, tracejadas, tracejadas por pontos, etc. (você também pode adicionar símbolos de plotagem às suas linhas ou alterar o peso das linhas).

— gung
fonte

Na verdade, isso é algo que eu sempre me perguntava: qual é o melhor gradiente de cores a ser usado?

— steffen 31/01

4

Não use gráficos de barras empilhadas. E em uma nota relacionada, se você tiver um item da escala Likert, não sinta a necessidade de mostrar a proporção de cada resposta a cada item. Esses gráficos fazem meus olhos sangrarem.

Não use gráficos de pizza.

Não duplique dados que estão contidos em um gráfico jogando em uma tabela.

Use uma fonte sans serif como Arial para títulos de gráficos etc., porque esses tipos de fontes foram projetados para serem usados dessa maneira.

Nenhuma postagem sobre design está completa sem uma referência de livro, eu realmente gosto de Regras de Estatística . O Capítulo 9 é o bit relevante para a discussão aqui, e os bits que aponto quando perguntados por que odeio gráficos de barras e gráficos de pizza empilhados. :)

Confissão: em uma das minhas primeiras funções de consultoria estudantil para um pequeno cliente de uma ONG, dei a eles um relatório com muitos gráficos de barras empilhados, impressos em cores (em meados dos anos 90). Eu acho que consegui colocar amarelo, roxo e vermelho nesses filhotes.

— Michelle
fonte

3

Não mexa com os eixos. Não corte as primeiras cem unidades apenas porque a inclinação do gráfico parece mais impressionante. A imagem ficará grudada e as pessoas lembrarão de um efeito muito maior do que o que foi realmente medido.

— xmjx
fonte

2

Cortar dados para alterar a inclinação aparente é fraudulento. OTOH, existe uma pergunta real sobre se os eixos devem sempre incluir 0 e (um pouco menos relacionados) a proporção usada. Cleveland defende que os gráficos são mais informativos se você maximizar os dados na janela de dados e o 'banco' inclinar para 45 graus. Conheça o seu público aqui: Cleveland argumenta que o público profissional deve ser considerado competente e instruído, mas com o público ingênuo, aponte explicitamente esses recursos e explique-os ou (possivelmente) não os use.

— gung - Restabelece Monica

Até o público profissional (suponho) meses depois, lembrará apenas da linha íngreme no gráfico e terá esquecido a interceptação e tudo mais. Você pode ter todos esses dados no gráfico (simples) rotulando os valores extremos corretamente e ainda ter a informação de que nada realmente mudou no tempo.

— Xmjx

2

Discordo. Não acho que seja uma regra sensata insistir em que todos os eixos comecem com zero, se é isso que está sendo sugerido. Os gráficos devem mostrar variação e estrutura dos dados - se o que é importante é uma flutuação de 100.000 em torno do valor de dois milhões (e talvez como seja diferente entre dois grupos), o gráfico deve mostrar que, não que "dois milhões sejam um número grande "

— Peter Peter Ellis

Como em praticamente qualquer regra de design, acho que essa é uma regra que você pode quebrar se realmente entender o significado prático da variação plotada e como o público a interpretará. Mas essa regra é violada com tanta frequência e de maneira flagrante que eu acho relativamente seguro proclamar em voz alta "Todos os lotes devem incluir zero! *" Uma pesquisa no Google de lotes de imóveis americanos ilustra bem esse ponto - em quase todos os lotes, parece que os proprietários de imóveis flutuam nas últimas duas décadas, quando o spread máximo é de cerca de 5%.

— Matt Parker

Não que 5% sejam irrelevantes - e a maioria dessas parcelas está associada a argumentos sobre as consequências das políticas que geraram essa flutuação. Mas acho que esses argumentos seriam ainda mais fortes se enfatizassem como políticas massivas com enormes conseqüências econômicas realmente tinham efeitos relativamente pequenos na propriedade de casas.

— Matt Parker