Uma ideia potencial é o uso dos diagramas de Sankey para documentar o fluxo de opções entre as categorias. Dois exemplos para descrever o que estou falando são;
Com uma atualização sobre algumas de suas preocupações expressas nos comentários. Parece-me que o programa Parallel Sets faz o que você deseja fora da caixa. Abaixo está uma saída do programa, na qual criei 4 variáveis aleatórias com 4 categorias. Qualquer grupo que você inicializar na parte superior da exibição será dividido seqüencialmente entre as categorias subseqüentes. Criando a divisão que você deseja.
Também não é aparente nesta figura, o pacote possui algumas funcionalidades interativas que permitem uma análise exploratória mais fácil dos dados, como quando você passa o mouse sobre uma das categorias, todos os seus descendentes são destacados.
dec1
dec4
exp
dec
dec3_exp12
121
dec1 = 1 and dec2 = 2 and dec3 = 1
43
Depois de brincar mais com o Fineo, é uma aplicação interessante, mas é realmente limitada. Conjuntos Paralelos tem muito mais funcionalidade, então eu sugiro que você verifique isso antes do aplicativo Fineo.
Eu acho que o programa ParSets é uma opção muito melhor do que dividir sucessivamente as categorias em subconjuntos para exame. Por exemplo, usando os mesmos dados aleatórios acima, aqui está um gráfico de pontos que representa as categorias de proporção em decision 2
condicional escolhido na categoria escolhida para decision 1
.
Você pode fazer o mesmo detalhamento para a alteração de decision 2
para decision 3
, mas faça um pequeno gráfico múltiplo para o que decision 1
era inicial .
Você pode continuar isso infinitamente (veja abaixo). Pode ser esclarecedor, mas suspeito que seria bastante assustador quando você chegasse a muitos outros painéis. Abaixo, conforme solicitado, visualizando 4 opções de categoria sucessivas.
Como observado anteriormente, os pequenos números no momento em que você divide seu gráfico em tantas categorias são problemáticos. Uma maneira de explicar isso é mapear uma estética, como tamanho, para a linha de base na qual a proporção se baseia. Isso reduz as observações com base em números menores da visualização. Você também pode usar a transparência (mas eu já tornei os pontos transparentes para distinguir pontos com excesso de plotagem neste exemplo).
Eu imagino que alguns estavam visualizando uma árvore de Natal como estrutura de nós, em oposição a pontos, mas não sei como fazer esse gráfico. Eu suspeito que seria suspeito do mesmo problema avassalador. Esses múltiplos pequenos não são ruins, mas o IMO the Parallel Sets é muito mais intuitivo e suspeito que alguns padrões não óbvios seriam mais aparentes nessa visualização. Talvez alguém mais imaginativo do que eu possa apresentar alguns dados mais interessantes do que apenas quatro categorias aleatórias.