Estou tentando visualizar meu fluxo de dados com um Diagrama de Sankey em R.
Eu encontrei esta postagem do blog com um link para um script R que produz um Diagrama de Sankey, infelizmente é bastante bruto e um tanto limitado (veja abaixo para exemplos de código e dados).
Alguém conhece outros scripts - ou talvez até mesmo um pacote - que seja mais desenvolvido? Meu objetivo final é visualizar o fluxo de dados e as porcentagens por tamanho relativo dos componentes do diagrama, como nesses exemplos de Diagramas de Sankey .
Eu postei uma pergunta um tanto semelhante na lista r-help , mas depois de duas semanas sem nenhuma resposta, estou tentando a sorte aqui no stackoverflow.
Obrigada Eric
PS. Estou ciente do gráfico de conjuntos paralelos , mas não é isso que estou procurando.
# thanks to, https://tonybreyal.wordpress.com/2011/11/24/source_https-sourcing-an-r-script-from-github/
sourc.https <- function(url, ...) {
# install and load the RCurl package
if (match('RCurl', nomatch=0, installed.packages()[,1])==0) {
install.packages(c("RCurl"), dependencies = TRUE)
require(RCurl)
} else require(RCurl)
# parse and evaluate each .R script
sapply(c(url, ...), function(u) {
eval(parse(text = getURL(u, followlocation = TRUE,
cainfo = system.file("CurlSSL", "cacert.pem",
package = "RCurl"))), envir = .GlobalEnv)
} )
}
# from https://gist.github.com/1423501
sourc.https("https://raw.github.com/gist/1423501/55b3c6f11e4918cb6264492528b1ad01c429e581/Sankey.R")
# My example (there is another example inside Sankey.R):
inputs = c(6, 144)
losses = c(6,47,14,7, 7, 35, 34)
unit = "n ="
labels = c("Transfers",
"Referrals\n",
"Unable to Engage",
"Consultation only",
"Did not complete the intake",
"Did not engage in Treatment",
"Discontinued Mid-Treatment",
"Completed Treatment",
"Active in \nTreatment")
SankeyR(inputs,losses,unit,labels)
# Clean up my mess
rm("inputs", "labels", "losses", "SankeyR", "sourc.https", "unit")
Diagrama de Sankey produzido com o código acima,