Não deve ser muito complicado de fazer. Ainda não li o artigo mencionado, aqui está minha receita:
Auto-codificadores variacionais
Demonstração online com rostos morphing:
http://vdumoulin.github.io/morphing_faces/online_demo.html
e https://jmetzen.github.io/2015-11-27/vae.html para o codez.
Basicamente, isso fornece uma maneira de parametrizar o 'estilo' no seu caso, por exemplo, digamos o quão ampla ou difusa deve ser a pincelada. Coisas que dependem do estilo específico que você está tentando imitar.
No exemplo acima, diferentes faces 'morphed' ou 'imaginadas' são uma função dos parâmetros no espaço latente. Na imagem abaixo, isso seria o que você obtém alterando as coisas no nível do 'código'.
Aqui está a idéia básica: imagem original à esquerda, versão estilizada da mesma imagem à direita:
Agora, em teoria, se você treinar esse modelo em uma imagem normal e uma imagem estilizada como um alvo e adicionar convoluções, poderá aprender os filtros do kernel que correspondem ao tipo de "pinceladas" que o artista usa .
Obviamente, isso significa que você precisa ter alguns exemplos de imagens nas versões original e estilizada. Esse conjunto de dados seria bom doar para a comunidade - se você acabar fazendo isso, eu ficaria muito interessado em ver esse tipo de trabalho.
Boa sorte!
O artigo da wiki sobre codificadores automáticos seria um bom ponto de partida:
https://en.wikipedia.org/wiki/Autoencoder