5
Que função de recompensa resulta em um aprendizado ideal?
Vamos pensar nas seguintes situações: Você está ensinando um robô a jogar pingue-pongue Você está ensinando um programa para calcular raiz quadrada Você está ensinando matemática para uma criança na escola Essas situações (isto é, aprendizado supervisionado) e muitas outras têm uma coisa (entre outras) em comum: o aluno recebe …