1
O que é "repetição de experiência" e quais são seus benefícios?
Estive lendo DeepMind Atari do Google de papel e eu estou tentando entender o conceito de "experiência replay". A repetição da experiência aparece em muitos outros documentos de aprendizado por reforço (particularmente o artigo AlphaGo), então eu quero entender como isso funciona. Abaixo estão alguns trechos. Primeiro, usamos um mecanismo …