Estou tentando ver se existe um termo convencional para esse conceito para me ajudar na minha pesquisa e literatura. Quando um modelo de aprendizado de máquina faz com que uma ação seja executada no mundo real que afeta instâncias futuras, como é chamado?
Estou pensando em algo como um sistema de recomendação que recomenda um determinado produto e não recomenda outro produto. Então, você aumentou a probabilidade de alguém comprar o primeiro produto e diminuiu a probabilidade de alguém comprar o segundo produto. Portanto, esses números de vendas acabarão se tornando instâncias de treinamento, criando uma espécie de ciclo de feedback.
Existe um termo para isso?