Filtro de inicialização / algoritmo de filtro de partículas (Noções básicas)

Eu realmente tenho uma falta de entendimento de como o filtro de autoinicialização funciona. Conheço os conceitos aproximadamente, mas não consigo apreender certos detalhes. Esta pergunta é para eu esclarecer a desordem. Aqui vou usar esse algoritmo de filtro popular a partir de uma referência por doucet (até agora acho que essa é a referência mais fácil). Deixe-me primeiro dizer-lhe que meu problema é entender quais distribuições são conhecidas e quais são desconhecidas.

Estas são as minhas perguntas:

Em 2), qual é a distribuição ? Essa distribuição é conhecida ? Conhecemos essa distribuição para todos os ? Se sim, mas e se não pudermos provar? É engraçado que eles chamam essa etapa de amostragem de importância, mas não vejo distribuição de proposta. $p(x_t|x^{(i)}_{t-1})$ $t$
Também em 2) uma distribuição conhecida ? "Normalizar pesos de importância significa $p(y_t|\tilde{x}^{(i)}_{t})$ ? O que o til em $w^{(i)}_{t}=\frac{\tilde{w}^{(i)}_{t}}{\sum_{i=1}^{N}\tilde{w}^{(i)}_{t}}$ $x$ e ? Significa algo como não amostrado ou não normalizado, respectivamente? $w$
Eu apreciaria se alguém pudesse dar um exemplo simples de brinquedo usando distribuições conhecidas para usar esse filtro de inicialização. O objetivo final do filtro de autoinicialização não está claro para mim.

particle-filter

— tintinthong
fonte

Essa é a densidade de transição do estado ( ), que faz parte do seu modelo e, portanto, é conhecido. Você precisa fazer uma amostra dele no algoritmo básico, mas são possíveis aproximações. é a distribuição da proposta nesse caso. É usado porque a distribuição $x_t$ $p(x_t|x_{t-1})$ $p(x_t|x_{0:t-1},y_{1:t})$ geralmente não é tratável.
Sim, essa é a densidade de observação, que também faz parte do modelo e, portanto, é conhecida. Sim, é isso que significa normalização. O til é usado para significar algo como "preliminar": é antes de reamostragem, e é antes de renormalização. Eu acho que isso é feito dessa maneira para que a notação corresponda entre as variantes do algoritmo que não possuem uma etapa de reamostragem (ou seja, $\tilde{x}$ $x$ $\tilde{w}$ $w$ $x$ é sempre a estimativa final).
O objetivo final do filtro de autoinicialização é estimar a sequência de distribuições condicionais (o estado não observável em , considerando todas as observações até ). $p(x_t|y_{1:t})$ $t$ $t$

Considere o modelo simples:

X_{t} = X_{t - 1} + η_{t}, η_{t} \sim N (0 0, 1)

$X_t = X_{t-1} + \eta_t, \quad \eta_t \sim N(0,1)$

X_{0 0} \sim N (0 0, 1)

$X_0 \sim N(0,1)$

Y_{t} = X_{t} + ε_{t}, ε_{t} \sim N (0 0, 1)

$Y_t = X_t + \varepsilon_t, \quad \varepsilon_t \sim N(0,1)$

$Y$ $X$ $p(X_t|Y_1, ..., Y_t)$ exatamente com o filtro de Kalman, mas vamos usar o filtro de inicialização em seu pedido. Podemos reformular o modelo em termos de distribuição de transição de estado, distribuição inicial de estado e distribuição de observação (nessa ordem), que é mais útil para o filtro de partículas:

X_{t} | X_{t - 1} \sim N (X_{t - 1}, 1)

$X_t | X_{t-1} \sim N(X_{t-1},1)$

X_{0 0} \sim N (0 0, 1)

$X_0 \sim N(0,1)$

Y_{t} | X_{t} \sim N (X_{t}, 1)

$Y_t | X_t \sim N(X_t,1)$

Aplicando o algoritmo:

$N$ $X_0^{(i)} \sim N(0,1)$ .
$X_1^{(i)} | X_0^{(i)} \sim N(X_0^{(i)},1)$ $N$ .

$\tilde{w}_t^{(i)} = \phi(y_t; x_t^{(i)},1)$ $\phi(x; \mu, \sigma^2)$ $\mu$ $\sigma^2$ $y_t$
$w_t$ . Observe que uma partícula é um caminho completo de $x$ (ou seja, não basta redimensionar o último ponto, é a coisa toda, que eles denotam como $x_{0:t}^{(i)}$ )

Volte para a etapa 2, avançando com a versão reamostrada das partículas, até processarmos toda a série.

Uma implementação em R segue:

# Simulate some fake data
set.seed(123)

tau <- 100
x <- cumsum(rnorm(tau))
y <- x + rnorm(tau)

# Begin particle filter
N <- 1000
x.pf <- matrix(rep(NA,(tau+1)*N),nrow=tau+1)

# 1. Initialize
x.pf[1, ] <- rnorm(N)
m <- rep(NA,tau)
for (t in 2:(tau+1)) {
  # 2. Importance sampling step
  x.pf[t, ] <- x.pf[t-1,] + rnorm(N)

  #Likelihood
  w.tilde <- dnorm(y[t-1], mean=x.pf[t, ])

  #Normalize
  w <- w.tilde/sum(w.tilde)

  # NOTE: This step isn't part of your description of the algorithm, but I'm going to compute the mean
  # of the particle distribution here to compare with the Kalman filter later. Note that this is done BEFORE resampling
  m[t-1] <- sum(w*x.pf[t,])

  # 3. Resampling step
  s <- sample(1:N, size=N, replace=TRUE, prob=w)

  # Note: resample WHOLE path, not just x.pf[t, ]
  x.pf <- x.pf[, s]
}

plot(x)
lines(m,col="red")

# Let's do the Kalman filter to compare
library(dlm)
lines(dropFirst(dlmFilter(y, dlmModPoly(order=1))$m), col="blue")

legend("topleft", legend = c("Actual x", "Particle filter (mean)", "Kalman filter"), col=c("black","red","blue"), lwd=1)

O gráfico resultante:

Um tutorial útil é o de Doucet e Johansen, veja aqui .

— Chris Haug
fonte

Para seu ponto 2) na aplicação do algoritmo

X_{1}^{(i)} | X_{0}^{(i)} \sim N (0, 1)

$X_1^{(i)} | X_0^{(i)} \sim N(0,1)$ ->

X_{1}^{(i)} | X_{0}^{(i)} \sim N (X_{0}^{(i)}, 1)

$X_1^{(i)} | X_0^{(i)} \sim N(X_0^{(i)},1)$ ?? Muito obrigado. Eu tenho um filtro de bootstrap funcional nesse modelo. Obrigado pela ênfase em reamostrar os caminhos e não apenas as t-ésimas partículas.

— tintinthong 29/09/16

Correto, corrigi o erro de digitação #

— Chris Haug

Os caminhos não precisam ser amostrados novamente? De outra literatura, não há necessidade de provar os caminhos. Eu só preciso provar as partículas a cada passo do tempo. Eu queria saber se existe uma razão para reamostragem os caminhos

— tintinthong