O DeepMind afirma que sua rede Q profunda (DQN) conseguiu adaptar continuamente seu comportamento enquanto aprendia a jogar 49 jogos da Atari.
Depois de aprender todos os jogos com a mesma rede neural, o agente foi capaz de jogá-los todos nos níveis 'sobre-humanos' simultaneamente (sempre que foi apresentado aleatoriamente com um dos jogos) ou poderia ser bom apenas em um jogo por vez, porque a mudança exigiu uma reaprendizagem?