EDITAR
O link de @ unutbu no comentário é uma boa leitura introdutória.
O sólido entendimento do AlphaZero provavelmente requer um grau quantitativo (PhD?). Você está pedindo um curso intensivo no AlphaZero?
Observe que, a menos que você invista uma quantidade significativa de seu tempo, nada que eu diga funcionará. Não há livro que possa cobrir tudo. Você precisará trabalhar muito.
Vamos tentar. Curso intensivo para AlphaZero.
1. Compreensão básica em aprendizado de máquina
Número incontável de livros. Mas se você não tiver tempo, recomendo os cursos de aprendizado de máquina do professor Andrew Ng no Coursera.
Suas palavras-chave: conjuntos de treinamento, conjuntos de testes, descida de gradiente estocástico, taxa de aprendizado, GPU, função de custo, entropia cruzada .
2. Redes profundamente neutras
Você precisa entender sobre redes neurais. Eu recomendaria o livro de aprendizado profundo do professor Ian Goodfellow, se você estiver falando sério. Se você não tiver tempo, siga novamente o curso on-line do professor Andrew Ng no Coursera. Você não precisa ir embora em todos os capítulos (mas deveria!).
O YouTube tem muitas introduções rápidas às redes neurais, tente-as.
Suas palavras-chave: neurônio, camadas, pesos, viés, mini-lote, ativação .
3. Pesquisa de árvores em Monte Carlo
Você deve entender o que é Monte Carlo. Livros sobre Monte Carlo estão em toda parte na Amazônia. Leia a wikipedia sobre o MCTS, se você não tiver tempo.
Suas palavras-chave: amostragem, expansão, simulação, lançamentos, retropropagação .
3. Aprendizado por reforço
Suas palavras-chave: gradiente de política, descida de gradiente, taxa de aprendizado
5. Representação no tabuleiro de xadrez
O papel em si é mais simples. O modelo codifica o estado da placa (por exemplo, peças) como uma série de valores binários de codificação one-hot.
6. MCTS vs alfa-beta