Bom recurso online com dicas sobre associação gráfica entre duas variáveis ​​numéricas sob várias condições


22

Contexto:

Ao longo do tempo, adquiri um conjunto de heurísticas sobre como planejar efetivamente a associação entre duas variáveis ​​numéricas. Eu imagino que a maioria das pessoas que trabalha com dados teria um conjunto de regras semelhante.

Exemplos de tais regras podem ser:

  • Se uma das variáveis ​​for inclinada positivamente, considere plotar esse eixo em uma escala de log.
  • Se houver muitos pontos de dados (por exemplo, n> 1000), adote uma estratégia diferente, como usar alguma forma de transparência parcial ou amostrar os dados;
  • Se uma das variáveis ​​assume um número limitado de categorias discretas, considere o uso de um jitter ou um gráfico de girassol;
  • Se houver três ou mais variáveis, considere usar uma matriz de gráficos de dispersão;
  • Ajustar alguma forma de linha de tendência geralmente é útil;
  • Ajuste o tamanho do caractere de plotagem para o tamanho da amostra (para n maior, use um caractere de plotagem menor);
  • e assim por diante.

Questão:

Eu gostaria de poder indicar aos alunos uma página da web ou site que explica esses e outros truques para plotar efetivamente associações entre duas variáveis ​​numéricas, talvez com exemplos.

  • Existem páginas ou sites na internet que fazem um bom trabalho?

2
Se você puder encontrá-lo, o manual "Gráficos" impresso que acompanha as cópias mais antigas do Systat (pré-Windows, acredite ou não) seria um excelente recurso. Não apenas ilustrava todas essas regras (se bem me lembro), como estava cheia de concavidades e excelentes conselhos.
whuber

2
@whuber, um ótimo comentário. Leland Wilkinson, principal autora de Systat, e também autora de The Grammar of Graphics (que é mais um livro de ciência da computação do que um livro de estatística), tem um gosto muito bom pela exibição gráfica de dados. Suas apresentações são sempre muito eficazes para entregar suas mensagens.
StasK

@ Jeremy, você já deve saber o pacote ggplot2 para R, mas agora que a gramática dos gráficos foi mencionada, pensei em mencioná-lo também. Acho o pacote, o livro e o manual de referência on-line de Hadley Wickham muito úteis para transformar variáveis ​​numéricas em gráficos e gráficos úteis.
NRH 04/10

1
@ Jeromy, por que não reformular a pergunta (separadamente) como um wiki da comunidade, solicitando uma postagem por regra? Dessa forma, em vez de um conjunto de links, poderíamos ter um conjunto de regras votável e criar o recurso aqui.
David LeBauer

@ David Ok, eu adicionei uma pergunta geral wiki comunidade em melhores recursos para a concepção de parcelas stats.stackexchange.com/questions/16631/...
Jeromy Anglim

Respostas:


13

Não consigo pensar em grandes recursos on-line, mas um bom capítulo de livro (e facilmente disponível para download) que narra como explorar visualmente um conjunto grande e multidimensional de dados de maneira ponderada é Brendan O'Connor e Lukas Biewald. capítulo (aviso: o link está diretamente no PDF) do Beautiful Data . O capítulo é particularmente útil como recurso de ensino, porque incorpora o código R à narrativa.

Além disso, após uma reflexão mais aprofundada, acho que o clássico "Some Graphic and Semigraphic Displays" de John Tukey (convenientemente publicado no site de Edward Tufte) é uma introdução realmente maravilhosa, embora um tanto idiossincrática, à visualização.

Por alguma razão, pareço pensar em capítulos de livros ...


+1 Pelo menos estes capítulos estão disponíveis na Web: acho que isso se qualifica. Obrigado Aaron.
whuber

@ whuber obrigado por postar a recompensa; e @ashaw, ambos os links tornam a leitura interessante.
perfil completo de Jeromy Anglim

Percebo que o artigo de Tukey é um antecessor do tratamento expandido encontrado em seu livro EDA (1977) (exceto a seção final sobre pendurar rootogramas e histogramas).
whuber

11

Referências recentes:

Recursos mais antigos, mas relevantes


3
+1 As regras e os tutoriais parecem úteis, abrangentes - e proibitivos! Como é possível escrever sobre gráficos sem fornecer uma única ilustração ? :-)
whuber

1
A escolha foi difícil, mas concedeu a recompensa a essa resposta, porque, no geral, ela melhor aborda a questão conforme solicitado. O documento da ONU parece ser especialmente útil e acessível aos estudantes, com sua linguagem clara e muitos exemplos claros.
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.