Além da propriedade Markov (MP), uma propriedade adicional é a homogeneidade do tempo (TH): pode ser Markov, mas com sua matriz de transição
P ( t ), dependendo do tempo t . Por exemplo, pode depender do dia da semana em t se as observações forem diárias e, em seguida, uma dependência
X t em X t - 7 condicionada a X t - 1 pode ser diagnosticada se TH for indevidamente assumido.XtP(t)ttXtXt−7Xt−1
Supondo que TH seja válido, uma possível verificação para MP está testando que é independente de X t - 2 condicional em X t - 1 , como sugeriram Michael Chernick e StasK. Isso pode ser feito usando um teste para tabela de contingência. Podemos construir as n tabelas de contingência de X t e X t - 2
condicionais em { X t - 1 = x j } para os n valores possíveis x jXtXt−2Xt−1nXtXt−2{Xt−1=xj}nxje teste a independência. Isso também pode ser feito usando
com ℓ > 1 no lugar de X t - 2 .Xt−ℓℓ>1Xt−2
Em R, tabelas de contingência ou matrizes são facilmente produzido graças ao factor de instalação e as funções apply
,
sweep
. A idéia acima também pode ser explorada graficamente. Os pacotes ggplot2 ou lattice fornecem facilmente gráficos condicionais para comparar distribuições condicionais . Por exemplo, definindo i como índice de linha ejp(Xt|Xt−1=xj,Xt−2=xi)ij como o índice da coluna em treliça no MP deve levar a distribuições semelhantes dentro de uma coluna.
O cap. 5 do livro A análise estatística de processos estocásticos no tempo de JK Lindsey contém outras idéias para verificar suposições.
[## simulates a MC with transition matrix in 'trans', starting from 'ini'
simMC <- function(trans, ini = 1, N) {
X <- rep(NA, N)
Pcum <- t(apply(trans, 1, cumsum))
X[1] <- ini
for (t in 2:N) {
U <- runif(1)
X[t] <- findInterval(U, Pcum[X[t-1], ]) + 1
}
X
}
set.seed(1234)
## transition matrix
P <- matrix(c(0.1, 0.1, 0.1, 0.7,
0.1, 0.1, 0.6, 0.2,
0.1, 0.3, 0.2, 0.4,
0.2, 0.2, 0.3, 0.3),
nrow = 4, ncol = 4, byrow = TRUE)
N <- 2000
X <- simMC(trans = P, ini = 1, N = N)
## it is better to work with factors
X <- as.factor(X)
levels(X) <- LETTERS[1:4]
## table transitions and normalize each row
Phat <- table(X[1:(N-1)], X[2:N])
Phat <- sweep(x = Phat, MARGIN = 1, STATS = apply(Phat, 1, sum), FUN = "/")
## explicit dimnames
dimnames(Phat) <- lapply(list("X(t-1)=" ,"X(t)="),
paste, sep = "", levels(as.factor(X)))
## transition 3-fold contingency array
P3 <- table(X[1:(N-2)], X[2:(N-1)], X[3:N])
dimnames(P3) <- lapply(list("X(t-2)=", "X(t-1)=" ,"X(t)="),
paste, sep = "", levels(as.factor(X)))
## apply ONE indendence test
fisher.test(P3[ , 1, ], simulate.p.value = TRUE)
## plot conditional distr.
library(lattice)
X3 <- data.frame(X = X[3:N], lag1X = X[2:(N-1)], lag2X = X[1:(N-2)])
histogram( ~ X | lag1X + lag2X, data = X3, col = "SteelBlue3")
]