Livros sobre Aprendizagem por Reforço

9

Eu tenho tentado entender o aprendizado por reforço há algum tempo, mas de alguma forma não consigo visualizar como escrever um programa para aprender por reforço para resolver um problema do mundo da grade. Você pode me sugerir alguns livros que me ajudariam a construir uma concepção clara do aprendizado por reforço?

machine-learning books reinforcement-learning

— girl101
fonte

stats.stackexchange.com/questions/130130/…

— Anton Tarasenko

Por favor, consulte openai também é um bom lugar para aprender Aprendizagem por Reforço de python, basicamente

— Vineet Kothari

7

Aqui você tem algumas boas referências sobre Aprendizado por Reforço:

Clássico

Sutton RS, Barto AG. Aprendizado por Reforço: Uma Introdução. Cambridge, Massachusetts: A Bradford Book; 1998. 322 p.

O rascunho da segunda edição está disponível gratuitamente: http://incompleteideas.net/book/the-book-2nd.html

Russell / Norvig Capítulo 21:

Russell SJ, Norvig P, Davis E. Inteligência artificial: uma abordagem moderna. Rio Saddle Superior, NJ: Prentice Hall; 2010.

Mais técnico

Szepesvári C. Algoritmos para aprendizado por reforço. Palestras de Síntese sobre Inteligência Artificial e Machine Learning. 2010; 4 (1): 1–103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programação dinâmica e controle ideal. 4ª edição. Belmont, Massachusetts: Athena Scientific; 2007. 1270 p. O Capítulo 6, vol 2, está disponível gratuitamente: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Para desenvolvimentos mais recentes

Wiering M, van Otterlo M, editores. Aprendizado por Reforço. Berlim, Heidelberg: Springer Berlin Heidelberg; 2012 Disponível em: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Tomada de decisão sob incerteza: teoria e aplicação. 1 edição. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Aprendizado de reforço multi-agente

Buşoniu L, Babuška R, Schutter BD. Aprendizado de reforço multi-agente: uma visão geral. In: Srinivasan D, Jain LC, editores. Inovações em sistemas e aplicações multiagentes - 1. Springer Berlin Heidelberg; 2010 p. 183-221. Disponível em: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Aprendizado de máquina multi-agente: uma abordagem de reforço. Hoboken, Nova Jersey: Wiley; 2014.

Vídeos / Cursos

Eu também sugeriria o curso de David Silver no YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— Juan Leni
fonte

7

Existe um curso on-line gratuito sobre Aprendizado por Reforço pela Udacity. Verificar: Aprendizado de Máquina: Aprendizado por Reforço

— Sreejithc321
fonte

Vale ressaltar que um problema do mundo da rede é apresentado como parte desse curso.

— Neil Slater

sim, já vi isso, mas não o suficiente para código o mesmo

— girl101

4

Gostei muito do Reforço Leraning: uma introdução de Richard Sutton. Ele fornece uma visão unificadora muito boa da RL, embora não mencione as abordagens mais recentes (é de 1998).

— Martin Modrák
fonte

Na verdade, eu queria ver um problema mundial grade que está sendo resolvido por meio do cálculo de caneta e papel, porque isso iria me ajudar a entender o conceito, a menos que eu posso entender o conceito não posso código (especialmente valor iteração)

— girl101

1

Você pode conferir o meu livro - Aprendizado Prático de Reforço com Python, que explica o aprendizado por reforço desde o início até os algoritmos avançados de aprendizado por reforço profundo de última geração.

Todo o código, juntamente com a explicação, já está disponível no meu repositório do github. https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
fonte