Ambos (1) e (1b) estão corretos. O OP tem razão em que (neste modelo) pode haver um ponto de mudança em , e depende se existe um ponto de mudança. Isso não implica problemas com (1), pois os possíveis valores de são totalmente "cobertos" por . significa a distribuição condicional de condicional em . Essa distribuição condicional calcula a média de "tudo o resto", incluindo , condicional em . Assim como alguém poderia escrever, digamos,t+1xt+1rt+1P(xt+1∣rt,x1:t)P(xt+1|rt,x1:t)xt+1(rt,x1:t)rt+1(rt,x1:t)P(xt+1000|xt), que levaria em consideração todas as configurações possíveis dos pontos de mudança, bem como os valores de s ocorrendo entre e .xitt+1000
No restante, derivo primeiro (1) e depois (1b) com base em (1).
Derivação de (1)
Para quaisquer variáveis aleatórias , temos
desde que seja discreto (caso contrário, a soma precisa ser substituída por uma integral). Aplicando isso a :A,B,C
P(A∣B)=∑cP(A∣B,C=c)P(C=c∣B),
Cxt+1,x1:t,rt
P(xt+1∣x1:t)=∑rtP(xt+1∣rt,x1:t)P(rt∣x1:t),
que mantém, independentemente de quais sejam as dependências entre , , , ou seja, ainda não há suposições de modelo sido usado. No modelo atual, dado é assumido * como sendo condicionalmente independente dos valores de das execuções anteriores a . Isso implica . Substituindo isso na equação anterior, obtemos
rtx1:txt+1xt+1rt,x(r)txx(r)tP(xt+1∣rt,x1:t)=P(xt+1∣rt,x(r)t)
P(xt+1∣x1:t)=∑rtP(xt+1∣rt,x(r)t)P(rt∣x1:t),(1)
que é (1) no OP.
Derivação de (1b)
Vamos considerar a decomposição de sobre os valores possíveis de :
P(xt+1∣rt,x(r)t)rt+1
P(xt+1∣rt,x(r)t)=∑rt+1P(xt+1∣rt+1,rt,x(r)t)P(rt+1∣rt,x(r)t).
Como se assume * que se um ponto de mudança ocorre em (entre e ) não depende do histórico de , temos . Além disso, como determina se pertence à mesma execução que , temos . Substituindo essas duas simplificações pela fatoração acima, obtemos
t+1xtxt+1xP(rt+1∣rt,x(r)t)=P(rt+1∣rt)rt+1xt+1xtP(xt+1∣rt+1,rt,x(r)t)=P(xt+1∣rt+1,x(r)t)
P(xt+1∣rt,x(r)t)=∑rt+1P(xt+1∣rt+1,x(r)t)P(rt+1∣rt).
Substituindo isso em (1), obtemos
que é OP (1b).
P(xt+1∣x1:t)=∑rt(∑rt+1P(xt+1∣rt+1,x(r)t)P(rt+1∣rt))P(rt∣x1:t),(1b)
* Observação sobre as premissas de independência condicional do modelo
Com base na rápida navegação do artigo, eu pessoalmente gostaria que as propriedades de independência condicional fossem mais explicitamente declaradas em algum lugar, mas suponho que a intenção é que seja Markoviano e os : s associados a diferentes execuções sejam independentes (dadas as execuções).xrx