Recursos para aprender a criar visualizações de dados?


19

Estou interessado em aprender a criar o tipo de visualização que você vê em http://flowingdata.com e em informações é lindas . EDIT: Significado, visualizações que são interessantes por si só - como os gráficos do NY Times, em vez de algo rápido para um relatório.

Que tipos de ferramentas são usadas para criá-las - é principalmente um monte de Adobe Illustrator / Photoshop? Quais são os bons recursos (livros, sites, etc.) para aprender como usar essas ferramentas para visualização de dados em particular?

Eu sei como eu quero que as visualizações sejam (e eu estou familiarizado com os princípios de design, por exemplo, dos livros da Tufte), mas não tenho idéia de como criá-las.

Respostas:


20

Os dados fluidos discutem regularmente as ferramentas que ele usa. Veja, por exemplo:

Ele também mostra em detalhes como ele cria gráficos de vez em quando, como:

Há também outras perguntas neste site:

IMO, tente:

  1. R e ggplot2: este é um bom vídeo introdutório , mas o site ggplot2 possui muitos recursos.
  2. Processamento: muitos bons tutoriais na página inicial .
  3. Protovis: também uma infinidade de ótimos exemplos na página inicial .

Você pode usar a Adobe posteriormente para limpá-las.

Você também pode olhar para o webvispacote R , embora não seja tão completo quanto ggplot2. No R, você pode executar este comando para ver o exemplo do Playfair's Wheat:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Por fim, meus aplicativos comerciais favoritos para visualização interativa são:


1
Impressionantes, ótimos links! Eu já uso R e ggplot2, mas as visualizações de lá parecem mais a variedade "gráficos para um relatório", do que a variedade "visual / interessante para os olhos", que estou procurando. (O ggplot2 é super bonito, mas não tem a intenção de permitir criatividade ilimitada.) Estou errado ?, ou às vezes você usa o R / ggplot2 como entrada para outra ferramenta de visualização?
raegtin

5

O processamento já mencionado tem um bom conjunto de livros disponíveis. Veja: 1 , 2 , 3 , 4 , 5 , 6 , 7

Você encontrará muitas coisas na web para ajudá-lo a começar com R. Como próximo passo, o ggplot2 possui uma excelente documentação da web . Também achei o livro de Hadley muito útil.

Python pode ser outro caminho a percorrer. Especialmente com ferramentas como:

Todos os projetos estão bem documentados na web. Você também pode considerar espreitar alguns livros .

Por fim, o livro Gráficos de grandes conjuntos de dados também pode ajudar.


igraphtrabalha em R também; para 3D openGL acelerado vis em R, use rgl& misc3dpackages.

Também as matplotlibparcelas são feias; eles podem ser bons para um usuário do gnuplot por muitos anos.

2

Você gastará muito tempo se familiarizando com R.

O RapidMiner é gratuito, de código aberto e gráfico, e possui muitas boas visualizações, e você pode exportá-las.

Se você tem dinheiro de sobra ou é um estudante / funcionário da universidade, o JMP também é muito legal. Pode fazer alguns gráficos muito bonitos, com muita facilidade. Pode exportar para flash ou PNG ou PDF ou o que você tem.


5
1. O tempo gasto no IMHO com R é bem investido se você planeja fazer algo sério. 2. Considere também o KNIME knime.org como alternativa ao RapidMiner.
Radek

(+1) @radek. Eu também sou um fã de mineiros rápidos, mas, na minha opinião, não é flexível o suficiente para visualizações sofisticadas.
27611 steffen

Se você tiver alguma experiência em codificação, não precisará mais do que um dia para se familiarizar com o R. É bastante direto, no que diz respeito aos idiomas, e existem excelentes tutoriais online.
Naft101 13/05/12

1

Outra boa alternativa é a biblioteca protovis http://vis.stanford.edu/protovis/

É uma biblioteca JavaScript muito bem criada que pode criar belas visualizações se você tiver tempo e capacidade para escrever a quantidade modesta de código JavaScript necessário.

Eu também recomendo o Tableau http://www.tableausoftware.com . É ótimo para explorar rapidamente conjuntos de dados e criar muitas visualizações diferentes.

Ambos os produtos têm raízes no Stanford Visualization Group.


1

Muitas respostas excelentes foram fornecidas aqui, e os idiomas / bibliotecas que você escolhe aprender dependerão do tipo de visualização que você gostaria de fazer.

No entanto, se você usa o Python regularmente, recomendo o transporte marítimo . É muito sofisticado quando se trata de visualização de dados estatísticos, mas também parece bastante sofisticado do ponto de vista da apresentação.

Vamos dar um exemplo. Suponha que você esteja tentando planejar o consumo de eletricidade de um edifício comercial por mês. Um gráfico de linhas simples pode ser gerado no matplotlib para essa finalidade.

No entanto, se quiséssemos tornar a visualização mais sofisticada e informativa, poderíamos gerar um mapa de calor com o transporte marítimo:

mapa de calor

Um mapa de calor é apenas um exemplo. Alguns outros usos comuns com o transporte marítimo incluem:

  • Gráficos do KDE
  • Parcelas de enxame
  • Parcelas de violino

A idéia por trás do transporte marítimo é apresentar dados de uma maneira mais intuitiva do que seria possível usando gráficos mais simples, como linhas, barras, torta etc.

Se for do seu interesse - você pode encontrar mais informações sobre seaborn aqui: https://seaborn.pydata.org/



0

R é grande, mas não é que R é difícil de aprender é que a documentação é impossível procurar qualquer outro nome como Rq seria ótimo. Portanto, quando você tem um problema, procurar uma solução é um pesadelo, e a documentação também não é ótima. Matlab ou Octave será ótimo. E obter esses lotes em R ou Matlab seria muito, muito entediante.

IMHO pós-processamento visual é a melhor rota. Muitos deles a partir de dados fluidos são inseridos no Adobe Illustrator ou Gimp. É mais rápido. Depois de obter a estrutura do gráfico, altere os detalhes em um editor. Usar R como editor não oferece a flexibilidade que você deseja. Você se encontrará procurando novos pacotes o tempo todo.


R; function??- R tem ajuda embutida. você também pode geralmente procurar por "cran" para encontrar itens de R, e acho que a maioria dos principais mecanismos de pesquisa consegue lidar com a letra única o suficiente.
Naft101 13/05/12



-3

Existem infinitos recursos, mas você pode reduzi-los com base em como deseja que seus dados sejam transformados, em quantas fontes de dados você está lidando, em que precisam ser compartilhadas etc.

Aqui está um guia sobre como escolher o recurso certo que pode ajudar a direcioná-lo na direção certa.


1
Como você está associado a este grupo, declare interesse. As respostas apenas ao link não são as mais úteis. Os conselhos em stats.stackexchange.com/help/promotion podem ser aplicados.
Nick Cox
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.