Concordo que o "melhor" gráfico não existe independentemente do conjunto de dados, leitores e finalidade. Para duas variáveis medidas, os gráficos de dispersão são indiscutivelmente o design que deixa todos os outros, exceto para fins específicos, mas nenhum líder de mercado é evidente para dados categóricos.
Meu objetivo aqui é apenas mencionar um método simples, muitas vezes redescoberto ou reinventado, mas, mesmo assim, muitas vezes esquecido mesmo em monografias ou livros didáticos que cobrem gráficos estatísticos.
Exemplo primeiro, cobrindo os mesmos dados publicados por xan:
Se um nome é desejado, como costuma ser, este é um gráfico de barras de duas maneiras (neste caso). Não vou catalogar outros termos aqui, exceto que o gráfico de barras múltiplo é uma alternativa comum com sabor semelhante. (Minha pequena objeção ao "gráfico de barras múltiplo" é que o "múltiplo" não exclui os gráficos de barras empilhados lado a lado ou muito comuns, enquanto o "twoway" para mim implica mais claramente um layout de linha e coluna, embora por sua vez pode levar exemplos para deixar isso claro.)
Prós e contras para esse tipo de enredo também são simples, mas vou explicar alguns. Como eu gosto desse design (que remonta pelo menos aos anos 30), outros podem querer acrescentar críticas mais nítidas.
+1. A ideia é facilmente compreendida , mesmo por grupos não técnicos. As alturas ou comprimentos das barras codificam frequências neste exemplo. Em outros exemplos, eles podem codificar porcentagens calculadas da maneira que desejar, resíduos, etc.
+2. A estrutura de linha e coluna corresponde à de uma tabela . Você também pode adicionar valores numéricos. Quantidades muito pequenas e até zeros implícitos são claramente evidentes, o que nem sempre é o caso de outros projetos (por exemplo, gráficos de barras empilhados, gráficos em mosaico). A rotulagem de linhas e colunas geralmente é mais eficiente do que adicionar uma chave ou legenda, com o mental "ir e vir" que isso exige. Assim, esse design hibrida idéias de gráficos e tabelas, o que aparentemente incomoda alguns leitores; por outro lado, eu argumentaria que fortes distinções entre Figuras e Tabelas são apenas ressacas históricas, obsoletas agora que os pesquisadores podem preparar seus próprios documentos e não precisam depender de designers, compositores e impressoras.
+3. Extensões para projetos de três vias e superiores são fáceis em princípio . Coloque duas ou mais variáveis como variáveis compostas em um ou ambos os eixos ou forneça uma matriz desses gráficos. Naturalmente, quanto mais complicado o design, mais complicada é a interpretação.
+4. O design permite claramente variáveis ordinais em qualquer eixo. A ordem pode ser expressa (por exemplo) por sombreamento apropriado, bem como a ordem das categorias nesse eixo. A ordem das categorias nos eixos pode ser determinada pelo seu significado ou melhor determinada pelas frequências; a ordem alfabética de acordo com os rótulos de texto pode ser um padrão, mas nunca deve ser a única opção considerada.
-1. Por ter um design geral, o enredo pode ser menos eficiente em mostrar certos tipos de relacionamentos . Em particular, um enredo em mosaico pode deixar muito distantes as partidas da independência. Por outro lado, quando os relacionamentos entre variáveis categóricas são complicados ou pouco claros, normalmente nenhum gráfico é bom para mostrar mais do que esse fato fraco.
-2. De certa forma, o design é ineficiente no uso do espaço , deixando espaço para todas as combinações cruzadas, independentemente de sua ocorrência ou frequência. Este é o vício do mesmo princípio considerado uma virtude. O design particular acima dos espaços categoriza igualmente, independentemente de sua frequência; sacrifício que muitas vezes sacrifica rótulos marginais legíveis, que eu valorizo muito. Neste exemplo, os rótulos de texto são muito curtos, mas isso está longe de ser típico.
Nota: os dados do xan parecem apenas ser inventados, portanto, não tentarei uma interpretação mais do que tentamos em outras respostas. Mas alguma sabedoria caseira merece a última palavra aqui: o melhor design para você é aquele que melhor transmite a você e a seus leitores a estrutura de alguns dados reais com os quais você se importa.
Outros exemplos incluem
Como você pode visualizar a relação entre três variáveis categóricas?
Gráfico para relacionamento entre duas variáveis ordinais