Sucessor moderno da Análise Exploratória de Dados por Tukey?


52

Eu tenho lido o livro de Tukey "Análise Exploratória de Dados". Sendo escrito em 1977, o livro enfatiza os métodos de papel / lápis. Existe um sucessor mais "moderno" que leva em conta que agora podemos traçar instantaneamente grandes conjuntos de dados?


deve ser este wiki da comunidade?
227126 richardorrisroe

Não está claro para mim se isso deve ser CW. Pode não haver boas respostas; pode haver uma resposta clara e destacada; podemos gerar uma longa lista de respostas eficazes. Vamos ver o que acontece.
whuber

4
Esta é uma boa pergunta, biofreezer. Eu só queria observar que existem analogias estreitas com outros métodos de trabalho. Meu favorito é que caneta e papel A EDA é para estatísticas modernas, assim como as ferramentas manuais para madeira moderna. (A madeira "moderna" emprega muitas ferramentas elétricas, como serras de mesa e roteadores, que permitem que mesmo iniciantes produzam resultados aceitáveis ​​em muito menos tempo. No entanto, essas ferramentas também representam milhares de dígitos e membros ausentes todos os anos. Pessoas que aprendem a usar ferramentas manuais geralmente aprender a trabalhar melhor e de forma mais eficiente, mesmo quando eles empregam ferramentas eléctricas).
whuber

4
Sim, trabalhar madeira é uma boa analogia (dígitos ausentes, dígitos ausentes). Veja também software-carpentry.org .
Denis

Respostas:






4

Vale a pena mencionar aqui os dados Explorando dados de engenharia, ciências e medicina de Ronald Pearson . Seu principal público-alvo parece ser cientistas que não têm medo de um pouco de matemática que desejam conhecer mais estatísticas. Esse é um grupo bastante grande, e um bem representado aqui. É um pouco peculiar e excêntrico, mas cobre muito terreno e inclui muitos conselhos sensatos. Não é Tukey revisitado no sentido de oferecer muitas idéias novas, mas pode ser gratificante estudar, mesmo quando você pensa que é um pouco errado.

Este livro parece ter atraído muito pouca atenção, possivelmente porque é muito caro, não é obviamente adequado como texto do curso e ainda está disponível apenas em capa dura. Mas é inteligente, legível e livre do lixo dos modernos livros introdutórios (páginas e páginas de exercícios elementares, ícones bobos, fotos gratuitas de jovens felizes, layout exigente com caixas, o que for, etc.).



0

Outros bons livros para ler são Beautiful Visualization e Beautiful Data. São livros editados, há exemplos surpreendentemente bons de exploração de dados com gráficos e alguns capítulos absolutamente terríveis.

Outro livro que tem alguns bons exemplos de uso do ggplot2 é um novo de Winston Chang


11
Eu só quero checar, Di, caso ocorra um erro de digitação sutil: você quis dizer escrever "atraente" em vez de "terrível"? Embora ambos façam sentido nesse contexto, a aparência do último - sem maiores explicações - é uma surpresa!
whuber

2
terrível era correcto - isto é uma sacola - volumes editados frequentemente são
Dianne cozinheiro

Estou surpreso com essas recomendações. Achei os dois livros principalmente decepcionantes (muito tempo para rir, pouco gráficos). Infelizmente, O'Reilly, que encontrei pela primeira vez como editora de livros Unix espetacularmente bons, parece ter um controle de qualidade muito desigual para livros sobre qualquer coisa que seja remotamente estatística.
Nick Cox

Gosto dos dois livros e realmente sinto que são contribuições substanciais. O Winston Chang's tem muitos detalhes básicos sobre plotagem com o ggplot2. É uma boa referência para iniciantes. Não diz muito sobre o porquê de você fazer esses enredos, mas a maioria faz sentido para o propósito, a partir das peças que li. A Beautiful Visualization possui alguns capítulos muito impressionantes, abordando problemas difíceis como a visualização de wikipedia, dados maciços, muitas complexidades e passa pelo processo de pensamento / decisões tomadas para fazer as tramas.
Dianne Cook

Apenas no caso de meu comentário ser ambíguo: eu estava me referindo aos livros "Beautiful". O livro de Winston Chang é agradável e útil.
Nick Cox

0

Penso em Entendendo a análise robusta e exploratória de Hoaglin, Mosteller e Tukey e o volume complementar em Explorando tabelas e formas de dados como o acompanhamento técnico da EDA. Também vejo a análise e a regressão de dados, um segundo curso de estatística de Mosteller e Tukey como acompanhamento da EDA. Os vários livros de Cleveland mencionados acima são tesouros.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.