Eu não diria que há um interesse ou debate crescente sobre o uso de gráficos de pizza. Eles são encontrados em todos os lugares da Web e nas chamadas soluções "analíticas preditivas".
Acho que você conhece o trabalho de Tufte (ele também discutiu o uso de vários gráficos de pizza ), mas o mais engraçado é o fato de o segundo capítulo da Gramática de Gráficos de Wilkinson começar com "Como fazer um gráfico de pizza?". Você provavelmente também está ciente de que o gráfico de pontos de Cleveland , ou mesmo um gráfico de barras , transmitirá informações muito mais precisas. O problema parece realmente resultar da maneira como nosso sistema visual é capaz de lidar com informações espaciais. É até citado no software R; da ajuda on-line para pie
,
Cleveland (1985), página 264: “Os dados que podem ser mostrados por gráficos de pizza sempre podem ser mostrados por um gráfico de pontos. Isso significa que julgamentos de posição em uma escala comum podem ser feitos em vez de julgamentos angulares menos precisos. ”Essa afirmação é baseada nas investigações empíricas de Cleveland e McGill, bem como nas investigações de psicólogos perceptivos.
Cleveland, WS (1985) Os elementos dos dados gráficos . Wadsworth: Monterey, CA, EUA.
Existem variações de gráficos de setores circulares (por exemplo, gráficos tipo rosquinha) que levantam os mesmos problemas: Não somos bons em avaliar ângulo e área. Mesmo os usados em "corrgram", como descrito em Friendly, Corrgrams: Monitores exploratórios para matrizes de correlação , American Statistician (2002) 56: 316, são difíceis de ler, IMHO.
Em algum momento, porém, eu me perguntei se elas ainda poderiam ser úteis, por exemplo (1) exibir duas classes é bom, mas aumentar o número de categorias geralmente piora a leitura (especialmente com forte desequilíbrio entre%), (2) julgamentos relativos são melhor que os absolutos, que exibir dois gráficos de pizza lado a lado deve favorecer uma melhor apreciação dos resultados do que uma estimativa simples, digamos, um gráfico de pizza misturando todos os resultados (por exemplo, uma tabela de classificação cruzada bidirecional). Aliás, fiz uma pergunta semelhante a Hadley Wickham, que gentilmente me indicou os seguintes artigos:
- Spence, I. (2005). Nenhuma torta humilde: as origens e o uso de um gráfico estatístico . Jornal de Estatísticas Educacionais e Comportamentais , 30 (4), 353-368.
- Heer, J. e Bostock, M. (2010). Percepção gráfica de crowdsourcing: usando o Turk mecânico para avaliar o design de visualização . CHI 2010 , 10 a 15 de abril de 2010, Atlanta, Geórgia, EUA.
Em suma, acho que elas são boas para representar de maneira grosseira a distribuição de 2 a 3 classes (eu as uso, de tempos em tempos, para mostrar a distribuição de machos e fêmeas em uma amostra em cima de um histograma de idades), mas eles devem ser acompanhados por frequências relativas ou contagens por serem realmente informativos. Uma tabela ainda faria um trabalho melhor, pois você pode adicionar margens e ir além das classificações bidirecionais.
Por fim, há exibições alternativas que são construídas com base na ideia do gráfico de pizza. Posso pensar no gráfico de torta quadrada ou waffle , descrito por Robert Kosara em Entendendo gráficos de pizza .