Parece haver uma razão de hardware para não fazer essa alteração.
O principal problema com o uso de Leela como oponente sparring é que ele funciona melhor em GPU. É possível executar Leela na CPU, mas o desempenho de Leela sofre muito. O OP sugere conceder a Leela chances de tempo para compensar, mas as probabilidades de tempo não funcionam muito bem: o desempenho de Leela enfraquece tanto que as chances de tempo exigidas são opressivamente longas.
Para ter uma idéia do quanto Leela está mais fraca na CPU, podemos olhar para Leela na 12ª temporada do TCEC, quando ele não tinha suporte para GPU e rodava na CPU. Aqui está um exemplo de jogo jogado por Leela então . Se observarmos as velocidades alcançadas, são cerca de 1-3kn / s, ou 1000-3000 posições por segundo. Comparativamente, na última temporada 15, quando Leela estava rodando em GPUs poderosas, atingia cerca de 50kn / s ( jogo de exemplo ). Portanto, para poder testar o Stockfish contra o Leela em termos iguais, é necessário dar ao Leela cerca de 25x de chances de tempo. Se o Stockfish tiver um minuto, Leela precisará de 25 minutos.
No momento da redação deste artigo, o Fishtesting testa em dois controles de tempo: 10s + 0,1s / movimento e 60s + 0,6s / movimento (os patches que passam no primeiro teste de controle de curto tempo são promovidos para o mais longo e testados novamente. passe o segundo e depois se torne a versão "nova"). Com probabilidades de 25x, Leela precisa de 250s + 2,5s / movimento no primeiro controle e 1500s + 15s / movimento no segundo controle. A desaceleração é tremenda; efetivamente teríamos Leela tocando em controles rápidos de tempo e não em balas. O número de jogos que podem ser concluídos em unidade de tempo também diminuiria em cerca de 25x. O teste de peixes precisa regularmente de dezenas de milhares de jogos para testar cada patch; levar 25 vezes mais tempo para terminar cada teste parece inaceitavelmente lento.
Para adicionar combustível ao fogo, até onde eu sei, Leela tinha uma rede menor na temporada 12 - o desempenho das redes mais recentes poderia ser ainda mais lento no CPU agora.
É possível que um dia, se o Fishtesting fizer com que os recursos da GPU testem com Leela, ele possa mudar; no entanto, ainda não estamos nesse ponto.
Edit : Lc0-CPU está atualmente jogando no TCEC. Fica cerca de 5 knps. De acordo com algumas pessoas no bate-papo, o Lc0-CPU é modificado para reproduzir na CPU; sem modificação, é cerca de 80x mais lento do que na GPU. Portanto, há um custo real de hardware para usar o Lc0-CPU como um oponente de teste.