Ao usar o algoritmo persistente de aprendizado de CD para Restricted Bolzmann Machines, iniciamos nossa cadeia de amostragem Gibbs na primeira iteração em um ponto de dados, mas, ao contrário do CD normal, nas iterações seguintes, não iniciamos novamente em nossa cadeia. Em vez disso, começamos onde a cadeia de amostragem de Gibbs na iteração anterior terminou.
No algoritmo de CD normal, cada iteração avalia um mini lote de pontos de dados e calcula as cadeias de amostragem Gibbs a partir desses próprios pontos de dados.
Em CD persistente, devemos manter as cadeias de amostragem de Gibbs para cada ponto de dados? Ou devemos manter também um mini lote de cadeias de amostragem Gibbs, iniciadas em pontos de dados que atualmente não são avaliados na iteração atual?
Parece-me que manter as cadeias de amostragem de Gibbs para cada ponto de dados será muito complicado, mas, por outro lado, parece inadequado comparar os sinais da amostra atual com os sinais após uma longa cadeia de Gibbs que não começou na corrente. amostra .