No meu campo, a maneira usual de plotar dados emparelhados é como uma série de segmentos finos de linhas inclinadas, sobrepondo-os à mediana e ao IC da mediana para os dois grupos:
No entanto, esse tipo de gráfico se torna muito mais difícil de ler à medida que o número de pontos de dados se torna muito grande (no meu caso, tenho da ordem de 10000 pares):
Reduzir o alfa ajuda um pouco, mas ainda não é ótimo. Enquanto procurava por uma solução, me deparei com este documento e decidi tentar implementar um 'gráfico de linhas paralelas'. Novamente, funciona muito bem para um pequeno número de pontos de dados:
Suponho que eu possa mostrar separadamente as distribuições para os dois grupos, por exemplo, com boxplots ou violinos, e traçar uma linha com barras de erro no topo, mostrando as duas medianas / ICs, mas eu realmente não gosto dessa idéia, pois ela não transmite a natureza emparelhada dos dados.
Também não estou muito entusiasmado com a idéia de um gráfico de dispersão 2D: eu preferiria uma representação mais compacta e, idealmente, uma na qual os valores para os dois grupos sejam plotados no mesmo eixo. Por uma questão de integridade, eis a aparência dos dados como uma dispersão 2D:
Alguém conhece uma maneira melhor de representar dados emparelhados com um tamanho de amostra muito grande? Você poderia me vincular a alguns exemplos?
Editar
Desculpe, eu claramente não fiz um trabalho bom o suficiente para explicar o que estou procurando. Sim, o gráfico de dispersão 2D funciona e há muitas maneiras pelas quais ele pode ser melhorado para transmitir melhor a densidade de pontos - eu poderia codificar por cores os pontos de acordo com uma estimativa de densidade do kernel, eu poderia fazer um histograma 2D , Eu poderia traçar contornos em cima dos pontos etc., etc ...
No entanto, acho que isso é um exagero para a mensagem que estou tentando transmitir. Eu realmente não me importo em mostrar a densidade 2D de pontos em si - tudo o que preciso fazer é mostrar que os valores para 'barras' são geralmente maiores que os valores para 'pontos', da maneira mais simples e clara possível e sem perder a natureza emparelhada essencial dos dados. Idealmente, gostaria de plotar os valores emparelhados para os dois grupos ao longo dos mesmos eixos, em vez de ortogonais, pois isso facilita a comparação visual dos mesmos.
Talvez não haja opção melhor do que um gráfico de dispersão, mas eu gostaria de saber se existem alternativas que possam funcionar.
bar
horizontal edot
vertical como um gráfico de dispersão?