Os retornos das ações são um exemplo decente da vida real do que você está pedindo. Existe uma correlação muito próxima de zero entre o retorno do S&P 500 de hoje e de ontem. No entanto, existe uma dependência clara: retornos quadrados são positivamente correlacionados automaticamente; períodos de alta volatilidade são agrupados no tempo.
Código R:
library(ggplot2)
library(grid)
library(quantmod)
symbols <- new.env()
date_from <- as.Date("1960-01-01")
date_to <- as.Date("2016-02-01")
getSymbols("^GSPC", env=symbols, src="yahoo", from=date_from, to=date_to) # S&P500
df <- data.frame(close=as.numeric(symbols$GSPC$GSPC.Close),
date=index(symbols$GSPC))
df$log_return <- c(NA, diff(log(df$close)))
df$log_return_lag <- c(NA, head(df$log_return, nrow(df) - 1))
cor(df$log_return, df$log_return_lag, use="pairwise.complete.obs") # 0.02
cor(df$log_return^2, df$log_return_lag^2, use="pairwise.complete.obs") # 0.14
acf(df$log_return, na.action=na.pass) # Basically zero autocorrelation
acf((df$log_return^2), na.action=na.pass) # Squared returns positively autocorrelated
p <- (ggplot(df, aes(x=date, y=log_return)) +
geom_point(alpha=0.5) +
theme_bw() + theme(panel.border=element_blank()))
p
ggsave("log_returns_s&p.png", p, width=10, height=8)
As séries temporais do log retornam no S&P 500:
Se os retornos fossem independentes ao longo do tempo (e estacionários), seria muito improvável ver esses padrões de volatilidade em cluster e você não veria a autocorrelação nos retornos quadrados de log.