A correlação mede a relação linear. No contexto informal, relacionamento significa algo estável. Quando calculamos a correlação da amostra para variáveis estacionárias e aumentamos o número de pontos de dados disponíveis, essa correlação da amostra tende a uma correlação verdadeira.
Pode-se demonstrar que, para preços, que geralmente são passeios aleatórios, a correlação da amostra tende a variável aleatória. Isso significa que, independentemente da quantidade de dados que temos, o resultado será sempre diferente.
Nota : tentei expressar intuição matemática sem a matemática. Do ponto de vista matemático, a explicação é muito clara: momentos de amostra de processos estacionários convergem em probabilidade para constantes. Momentos de amostra de passeios aleatórios convergem para integrais do movimento browniano, que são variáveis aleatórias. Como o relacionamento geralmente é expresso como um número e não como uma variável aleatória, torna-se evidente o motivo para não calcular a correlação para variáveis não estacionárias.
Atualização Como estamos interessados na correlação entre duas variáveis, assuma primeiro que elas provêm do processo estacionário . A estacionariedade implica que E Z t e c o v ( Z t , Z t - h ) não dependem de t . Então correlaçãoZt=(Xt,Yt)EZtcov(Zt,Zt−h)t
corr(Xt,Yt)=cov(Xt,Yt)DXtDYt−−−−−−−√
também não depende de , já que todas as quantidades na fórmula vêm da matriz c o v ( Z t ) , que não depende de t . Portanto, o cálculo da correlação da amostratcov(Zt)t
faz sentido, uma vez que pode ter esperança razoável de que correlação amostra irá estimarρ=corr(Xt,Yt). Acontece que essa esperança não é infundado, uma vez que para processo estacionário satisfazendo certas condições temos quep→
ρ^=1T∑Tt=1(Xt−X¯)(Yt−Y¯)1T2∑Tt=1(Xt−X¯)2∑Tt=1(Yt−Y¯)2−−−−−−−−−−−−−−−−−−−−−−−−−−−√
ρ=corr(Xt,Yt)ρ^→ρ, como
em probabilidade. Além disso
√T→∞em distribuição, de modo que podemos testar as hipóteses sobre
ρT−−√(ρ^−ρ)→N(0,σ2ρ)ρ .
Ztcorr(Xt,Yt) may depend on t. So when we observe a sample of size T we potentialy need to estimate T different correlations ρt. This is of course infeasible, so in best case scenario we only can estimate some functional of ρt such as mean or variance. But the result may not have sensible interpretation.
Agora, vamos examinar o que acontece com a correlação da caminhada aleatória do processo não estacionário provavelmente mais estudada. Chamamos o processo uma caminhada aleatória se Z t = ∑ t s = 1 ( U t , V t ) , onde C t = ( U t , V t ) é um processo estacionário. Por simplicidade, assuma que E C t = 0 . EntãoZt=(Xt,Yt)Zt=∑ts=1(Ut,Vt)Ct=(Ut,Vt)ECt=0
corr(XtYt)=EXtYtDXtDYt−−−−−−−√=E∑ts=1Ut∑ts=1VtD∑ts=1UtD∑ts=1Vt−−−−−−−−−−−−−−−−√
Ct=(Ut,Vt) is a white noise. This means that all correlations E(CtCt+h) are zero for h>0. Note that this does not restrict corr(Ut,Vt) to zero.
Then
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
So far so good, though the process is not stationary, correlation makes sense, although we had to make same restrictive assumptions.
Now to see what happens to sample correlation we will need to use the following fact about random walks, called functional central limit theorem:
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
in distribution, where
s∈[0,1] and
Ws=(W1s,W2s) is bivariate
Brownian motion (two-dimensional Wiener process). For convenience introduce definition
Ms=(M1s,M2s)=(cov(C0))−1/2Ws.
Again for simplicity let us define sample correlation as
ρ^=1T∑Tt=1XtYt1T∑Tt=1X2t1T∑Tt=1Y2t−−−−−−−−−−−−−−−−−−√
Let us start with the variances. We have
E1T∑t=1TX2t=1TE∑t=1T(∑s=1tUt)2=1T∑t=1Ttσ2U=σUT+12.
This goes to infinity as T increases, so we hit the first problem, sample variance does not converge. On the other hand continuous mapping theorem in conjunction with functional central limit theorem gives us
1T2∑t=1TX2t=∑t=1T1T(1T−−√∑s=1tUt)2→∫10M21sds
where convergence is convergence in distribution, as
T→∞.
Similarly we get
1T2∑t=1TY2t→∫10M22sds
and
1T2∑t=1TXtYt→∫10M1sM2sds
So finally for sample correlation of our random walk we get
ρ^→∫10M1sM2sds∫10M21sds∫10M22sds−−−−−−−−−−−−−−−√
in distribution as
T→∞.
So although correlation is well defined, sample correlation does not converge towards it, as in stationary process case. Instead it converges to a certain random variable.