Supondo que suas matrizes são algo como
então você pode interpretar cada linha como uma distribuição multinomial com os parâmetros
Pij=Pr[j∣i],Qij=∑t=1N[xt=i&xt+1=j]
ipi=Pi,:,ni=∑j=1KQij
Não tenho certeza de que você pode agrupar todas as linhas juntas, porque o "número de tentativas" variará entre as linhas.
Por exemplo, diga e seus dados são . Portanto, existem transições, com vindo de , mas de e somente de . Então, eu acho que sua confiança em geralmente deve ser maior do que sua confiança em .K=3x=[1,1,2,1,2,3,1,2]N=7n1=4x=1n2=2x=2n3=1x=3p^1p^3
(No caso extremo, talvez para este exemplo, seja realmente , mas você não tem dados sobre essas transições, pois Tratar "ausência de evidência como evidência de ausência" me pareceria problemático aqui.)K4n4=0
Eu não estou muito familiarizado com testes qui-quadrado, mas isso sugere que você pode tratar as linhas de forma independente (ou seja, somar apenas sobre e usar vez de ). Esse raciocínio não parece específico para o teste do qui-quadrado, portanto, também deve ser aplicado a qualquer outro teste de significância que você possa usar (por exemplo, multinomial exato ).jniN
A questão principal é que as probabilidades de transição são condicionais , portanto, para cada entrada na matriz, apenas as transições que satisfazem sua pré-condição são relevantes. De fato, presumivelmente, a matriz de transição satisfará ; portanto, a "matriz empírica de transição" deve ser .∑jPij=1P^ij=Qij/ni
Atualização: em resposta à consulta do OP, um esclarecimento sobre os "parâmetros de teste".
Se houver estados na cadeia de Markov, ou seja, , na linha , a distribuição multinomial correspondente terá o vetor de probabilidade e número de tentativas , fornecidas acima.KP∈RK×Kipi∈RKni∈N
Portanto, haverá categorias e o vetor de probabilidade terá graus de liberdade, como . Portanto, para a linha a estatística correspondente seria
que será assintoticamente siga um qui-quadrado distribuído com graus de liberdade (como indicado aqui e aqui ). Veja também aqui uma discussão sobre quando o é apropriado e testes alternativos que podem ser mais apropriados.KpiK−1∑Kj=1(pi)j=1iχ2
χ2i=∑j(Qij−niPij)2niPij
K−1χ2
Ele pode ser possível fazer um "teste aglomeradas", assumindo segue uma distribuição do Qui-quadrado com DOF de (isto é, soma DOFs sobre linhas). No entanto, não tenho certeza se o pode ser tratado como independente. De qualquer forma, os testes em linhas parecem mais informativos, portanto, podem ser preferíveis a um teste agrupado.χ2P=∑iχ2iK(K−1)χ2i