Rao-Blackwellization de filtros seqüenciais de Monte Carlo

No artigo seminal "Rao-Blackwellised Particle Filtering for Dynamic Bayesian Networks" de A. Doucet et. al. é proposto um filtro seqüencial de Monte Carlo (filtro de partículas), que utiliza uma subestrutura linear em um processo markov . Pela marginalização dessa estrutura linear, o filtro pode ser dividido em duas partes: uma parte não linear que utiliza um filtro de partículas e uma parte linear que pode ser manuseada por um filtro Kalman (condicionado na parte não linear ) $x^L_k$ $x_k = (x^L_k, x^N_k)$ $x^N_k$

Entendo a parte da marginalização (e às vezes o filtro descrito também é chamado de filtro marginalizado). Minha intuição por que é chamado de filtro de partículas Rao-Blackwellized (RBPF) é que os parâmetros Gaussianos são uma estatística suficiente para o processo linear subjacente e, seguindo o teorema de Rao-Blackwell, um estimador condicionado a esses parâmetros tem um desempenho tão bom quanto como estimador de amostragem.

O estimador Rao-Blackwell é definido como . Nesse contexto, eu diria que é o estimador de Monte Carlo, o RBPF e a parametrização gaussiana. Meu problema é que não vejo onde isso é realmente aplicado no artigo. $E(\delta(X)|T(X)) = \delta_1(X)$ $\delta(X)$ $\delta_1(X)$ $T(X)$

Então, por que isso é chamado de Filtro de Partículas Rao-Blackwellized e onde a Rao-Blackwellization realmente acontece?

monte-carlo particle-filter

— Jakob
fonte

$\widehat{I^1}$ $\mathbb{E}[f]$ $\widehat{I^2}$

Mais adiante neste artigo, a expectativa é calculada usando os filtros de Kalman.

— Hunaphu
fonte