Atualmente, estou lendo alguns artigos sobre o agrupamento de cadeias de Markov e não vejo a diferença entre uma cadeia de Markov e um gráfico ponderado direcionado simples.
Por exemplo, no artigo Agrupamento ideal do espaço de estado nas cadeias de Markov, eles fornecem a seguinte definição de CTMC (cadeia de Markov de tempo contínuo):
Consideramos um CTMC finito com espaço de estado S = { x 1 , x 2 , … , x n } por uma matriz de taxa de transição Q : S × S → R + .
Eles não mencionam a propriedade Markov e, de fato, se o peso nas bordas representa uma probabilidade, acredito que a propriedade Markov seja trivial, pois a probabilidade depende apenas do estado atual da cadeia e não do caminho que leva para isso.
Em outro artigo, Sobre as propriedades relacionais da Lumpability, as cadeias de Markov são definidas da mesma forma:
Uma cadeia de Markov será representada como um trigêmeo ( S , P , π ) onde S é o conjunto finito de estados de M , P a matriz de probabilidade de transição indicando a probabilidade de passar de um estado para outro e π é a probabilidade inicial distribuição que representa a probabilidade de o sistema iniciar em um determinado estado.
Novamente, nenhuma menção de passado, futuro ou independência.
Há um terceiro artigo Simple O (m logn) Time Markov Chain Lumping onde eles não apenas nunca afirmam que os pesos nas bordas são probabilidades, mas até dizem:
Em muitas aplicações, os valores não são negativos. No entanto, não fazemos essa suposição, porque também existem aplicativos em que W ( s , s ) é escolhido deliberadamente como - W ( s , S ∖ { s } ) , tornando-o geralmente negativo.
Além disso, afirma-se que o agrupamento deve ser uma maneira de reduzir o número de estados enquanto mantém a propriedade Markov (agregando um estado "equivalente" a um estado maior). No entanto, para mim, parece que está simplesmente somando probabilidades e nem deveria garantir que as peobabilidades resultantes das transições para / dos estados agregados estejam no intervalo . O que a massa realmente preserva então?
Então, existem duas possibilidades que eu vejo:
- Eu não entendi o que é uma cadeia de Markov, ou
- O uso do termo cadeia de Markov nesses documentos é falso
Alguém poderia esclarecer a situação?
Realmente parece que existem comunidades diferentes usando esse termo e elas significam coisas muito diferentes. Desses 3 artigos que estou considerando, parece que a propriedade Markov é trivial ou inútil, enquanto olhando para um tipo diferente de papel parece fundamental.