A área ou o comprimento de um quadrado deve ser proporcional aos dados que estão sendo visualizados?


16

Estou fazendo uma visualização de dados. Cada dado é representado por um quadrado. Para tornar os dados subjacentes intuitivamente legíveis, o comprimento do lado de cada quadrado ou a área de cada quadrado devem ser proporcionais ao dado que ele representa?


1
Ainda não. É amplo? Eu esperava que a resposta fosse definitiva (suponho que seja "área"), mas as pessoas aqui teriam mais design gráfico e conhecimento perceptivo em psicologia para sustentar isso.
dumbledad

1
O IIRC foi abordado em um livro alemão que li uma vez, "So lügt man mit Statistik" de en.wikipedia.org/wiki/Walter_Krämer - não tenho certeza se existe um equivalente em inglês. TL; DR - depende do que você deseja que seus leitores leiam nas visualizações.
22715 Michael Schumacher

A resposta certamente não é definitiva. Tudo depende de detalhes - quais são os dados que você está apresentando, como está apresentando e o que deseja se comunicar com esses dados.
DA01

Você pode dar exemplos em que as especificidades ou o que queremos que os leitores leiam da visualização nos levariam a optar por tornar o comprimento do lado de um quadrado proporcional ao dado em vez da área do quadrado?
dumbledad

5
+1 Por que todas as perguntas interessantes atraem pelo menos um voto próximo?!? <grump>
user56reinstatemonica8

Respostas:


10

Se você, o criador, não tiver certeza, como o leitor saberá qual é?

Resposta curta: o valor deve estar vinculado 1: 1 à quantidade de cores na página . Portanto, no seu exemplo, deve ser área. Mas há mais do que isso: você também precisa evitar sugestões enganosas que possam fazer com que o leitor a leia incorretamente, e precisa saber por que está usando área em vez de comprimento (por exemplo, gráficos de barras), porque possui prós e contras reais.


Primeiro, nunca altere o comprimento e a largura (ou seja, a área) de uma forma quando, na verdade, a variável está vinculada apenas ao comprimento de um lado. Se X for Y duplo, mas Y tiver quatro vezes mais cores na página, você estará enganando seus leitores. Esse tipo de distorção é algumas vezes chamado de " fator de mentira " e é frequentemente considerado uma tentativa deliberada de enganar e exagerar as diferenças.

insira a descrição da imagem aqui


Se você usar a área como uma medida, eu recomendo fortemente:

  • Saber por que você está usando a área . Ao usar a área em vez de uma dimensão linear como o comprimento, você:

    • Sacrifique a capacidade de ver claramente as diferenças matematicamente (você não pode facilmente dizer "olhe, isso é o dobro da outra")
    • Convide seus leitores para visualizá-lo de maneira intuitiva e não numérica todos os dias, da mesma forma como as pessoas, por exemplo, comparam tamanhos de tortas em uma loja. Menos sofisticado, mas mais imediato. Mais intestino, menos cabeça.
    • Pequenas diferenças entre números muito semelhantes tornam-se quase invisíveis.
    • Quando uma variável é muitas vezes menor que a outra, a muito pequena não desaparece tão mal quanto em um gráfico de barras, o que pode permitir mais flexibilidade nos layouts.

insira a descrição da imagem aqui

  • Considere usar círculos para a área, não quadrados, alinhados ao centro :

    • Círculos porque não causa confusão com gráficos de barras e similares. Altura e largura são menos evidentes: parece menos que você está convidando uma comparação baseada em altura ou largura.
    • Alinhado ao centro porque não convida as pessoas a comparar alturas

insira a descrição da imagem aqui

Por exemplo, acima, é difícil não ver o quadrado rotulado "5" como sendo três quartos da altura do quadrado rotulado "10", portanto é potencialmente enganador.

Os círculos não convidam esse tipo de comparação: é mais um instante no nível do intestino: "Esse blob é bem maior do que o próximo blob".


Existe uma variedade de evidências, desde testes de usuários a estudos de pequena escala (que tentarão caçar alguns exemplos posteriormente) de que esse tipo de comparação intuitiva baseada em área pode ser mais envolvente, pode reduzir a barreira de entrada para públicos menos engajados e pode ajude a manter o foco do leitor no assunto, e não nas minúcias frias dos números. Mas isso tem o custo de atrapalhar análises mais numericamente pensadas.

Não escolha entre uma dimensão (comprimento ou distância) e duas dimensões (área) por razões estéticas: escolha entre elas com base no seu público e mensagem.

O que é mais apropriado para a comunicação: comparações instantâneas no nível de intestino no nível de "muito maior" ou comparações numéricas mais consideradas no nível de "isso é cerca de 80% do outro"?

Ou existem razões práticas para você usar a área?

Então, quando você escolher por motivos práticos , aplique a estética.


A "proporcional à quantidade de cores na página" é uma regra prática muito útil (pelo menos em 2D); obrigado por isso vou usá-lo. O projeto que eu estou indo para se baseia em círculos, eu acho que você está ali
dumbledad

5

Eu diria que a área. Opticamente, um quadrado com um lado duas vezes maior mostra uma área 4 vezes maior. Observadores casuais se relacionarão com a área, mesmo sem ler sua lenda.

Um bom exemplo é este gráfico lendário de Randall Munroe da xkcd :

insira a descrição da imagem aqui ( versão enorme e legível )


4

Não somos tão bons em julgar diferenças de área quanto em comprimento. Usamos o comprimento como proxy e, portanto, tendem a subestimar as diferenças de áreas.

Por esse motivo, um círculo que na verdade tem 2x a área de outro parece muito pequeno porque nosso cérebro está relacionando seus raios, que diferem por um fator de 1,4x.

Existem tentativas interessantes de reconciliar esse fenômeno, como o Mapeamento proporcional de símbolos em R , que propõe uma escala perceptiva de símbolos para se alinhar mais de perto com a maneira como julgamos comprimentos e áreas.

Aqui está a Fig. 2 deste artigo

insira a descrição da imagem aqui

Pessoalmente, não tenho nenhuma experiência com isso e evito usar áreas se forem necessários julgamentos quantitativos.

Uma tangente interessante é a relação entre percepção de volume e comprimento. A diferença em como os percebemos é ainda mais impressionante. Isso pode ser ilustrado neste vídeo de comparações de tamanho de estrela .

Quando você chega à estrela maior, que tem cerca de 1.700x o diâmetro do sol, fica com a impressão de que ela é muito maior que 1.700x.

Para uma visão mais sistemática do nosso erro na percepção de diferenças em áreas e comprimentos, consulte Percepção gráfica de crowdsourcing: uso do turco mecânico para avaliar o design de visualização de Jeffrey Heer e Michael Bostock.


4

Na minha opinião, a área (D), não cada lado (E).

Se você estiver usando um lado do comprimento 2, a área seria 4 vezes o valor e você teria um gráfico muito sobreposto. (E)

Quando você tem um gráfico de barras normal (A), os dados são lineares e o da barra é apenas estético. (B)

Nesses casos, a área novamente é representativa dos dados, porque o das barras é o mesmo. Você pode ter uma barra 3D e ainda assim o volume da barra é o que representa os dados (C)

Gráficos ilustrando as diferenças de percepção de dimensionamento e sobreposição


4 vezes? Não é a diferença entre linear e ao quadrado?
dumbledad

Deixe-me ilustrar e editar a postagem.
21415 Rafael

Suponha que o dado seja 81. Se usarmos a área, os lados terão comprimento 9, dando uma área de 81. Se fizermos lados, eles terão o comprimento 81 e a área será 6.561. 81 não é 4 vezes 9 e 6.561 não é 4 vezes 81. De onde você tira 4?
dumbledad

"Se você estiver usando um lado de comprimento 2, a área será 4 vezes maior que o valor". Não sei dizer o que você está tentando dizer lá. Acho que você quer dizer que, se você estiver usando o comprimento do lado para representar a magnitude dos dados, dobrar o valor dos dados multiplicará a área por quatro.
David Richerby

David - essa é a minha edição! O post original de Rafael dizia "se você estiver usando um lado, a área seria 4 vezes o valor". Se você souber uma maneira melhor de esclarecer isso, faça isso.
dumbledad

1

Tufte lidou com isso extensivamente. Vejo:

  • A exibição visual de informações quantitativas,
  • Prevendo informações e outros.

Alguns princípios de integridade gráfica:

  1. A representação dos números, medida fisicamente na superfície do gráfico, deve ser diretamente proporcional às quantidades numéricas representadas
  2. Rotulagem clara, detalhada e completa deve ser usada para combater a distorção gráfica e a ambiguidade. Escreva explicações sobre os dados no próprio gráfico. Rotule eventos importantes nos dados.
  3. Mostrar variação de dados, não variação de design.
  4. Nas exibições de moeda das séries temporais, as unidades de medida monetária deflacionadas e padronizadas são quase sempre melhores que as unidades nominais.
  5. O número de informações com dimensões (variáveis) representadas não deve exceder o número de dimensões nos dados. Os gráficos não devem citar dados fora de contexto.

No seu caso, você deve se perguntar se os dados são melhor representados por uma imagem ou linha 2D ou 3D. Um cubo, um quadrado e uma linha não são os mesmos. Essa é uma das razões pelas quais os gráficos de barras 3D frequentemente enganam.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.