Respostas:
Do papel Deep Stack :
Parece ser para treinamento:
Para a rede de turnos, foram geradas e resolvidas dez milhões de situações de turnos de pôquer (após a troca da carta), com 6.144 núcleos de CPU do cluster de pesquisa MP2 do Calcul Quebec, usando mais de 175 anos principais de tempo de computação. Para a rede de flop, um milhão de situações de flop de poker (depois de distribuídas as cartas de flop) foram geradas e resolvidas. Essas situações foram resolvidas usando o solucionador de profundidade com profundidade limitada do DeepStack, com a rede de turnos usada para os valores contrafactuais em estados públicos imediatamente após a placa do turno. Utilizamos um cluster de 20 GPUS e metade de um ano de GPU de tempo de computação. Para a rede auxiliar, dez milhões de situações foram geradas e os valores-alvo foram obtidos enumerando todos os 22.100 flops possíveis e calculando a média dos valores contrafactuais da saída da rede de flop.
E isso para jogar de verdade:
As avaliações de resolução de redes e redes neurais são implementadas no Torch7 (53) e executadas em uma única placa gráfica NVIDIA GeForce GTX 1080.
Para comparação: a versão distribuída do AlphaGo levou 1.920 CPUs e 280 GPUs para executar.