Para dados longitudinais com resultado numérico, posso usar gráficos de espaguete para visualizar os dados. Por exemplo, algo assim (extraído do site Estatísticas da UCLA):
tolerance<-read.table("http://www.ats.ucla.edu/stat/r/faq/tolpp.csv",sep=",", header=T)
head(tolerance, n=10)
interaction.plot(tolerance$time, tolerance$id, tolerance$tolerance,
xlab="time", ylab="Tolerance", legend=F)
Mas e se meu resultado for binário 0 ou 1? Por exemplo, nos dados "ohio" em R, a variável binária "resp" indica a presença de uma doença respiratória:
library(geepack)
ohio2 <- ohio[2049:2148,]
head(ohio2, n=12)
resp id age smoke
2049 1 512 -2 1
2050 0 512 -1 1
2051 0 512 0 1
2052 0 512 1 1
2053 1 513 -2 1
2054 0 513 -1 1
2055 0 513 0 1
2056 1 513 1 1
2057 1 514 -2 1
2058 0 514 -1 1
2059 0 514 0 1
2060 1 514 1 1
interaction.plot(ohio2$age+9, ohio2$id, ohio2$resp,
xlab="age", ylab="Wheeze status", legend=F)
O gráfico de espaguete fornece uma boa figura, mas não é muito informativo e não me diz muito. Qual seria uma maneira adequada de visualizar esse tipo de dados? Talvez algo que inclua um valor de probabilidade no eixo y?
ohio
dados (2.15) (pelo menos não como parte da base). Está em uma versão mais recente ou através de alguma outra biblioteca? Esta seria uma aplicação interessante para um mapa de calor com indivíduos no eixo Y e resultados no eixo X, depois plotar 1 respostas em preto e 0 respostas em branco. A classificação da matriz fornecerá uma visão geral de quão diferentes são os padrões predominantes.
geepack
pacote.