É improvável que isso adicione muito além de seus esforços diretos de coleta de dados.
A qualidade das saídas atuais da GAN (a partir de 2017) não será alta o suficiente. As imagens produzidas por um GAN geralmente são pequenas e podem ter detalhes incomuns / ambíguos e distorções estranhas. No artigo que você vinculou, as imagens geradas pelo sistema a partir de uma sentença têm blocos de cores confiáveis, de acordo com o assunto, mas sem a sentença o informar o que esperar a maioria deles não é reconhecível como um assunto específico.
Os GANs com um objetivo menos ambicioso do que gerar imagens a partir de sentenças (o que, apesar das minhas críticas acima, um feito verdadeiramente notável da IMO) devem produzir imagens mais realistas. Mas seu escopo será menor e provavelmente não incluirá o tipo de imagem desejado. Além disso, normalmente o tamanho da saída é pequeno, por exemplo, 64x64 ou 128x128 *, e ainda existem distorções e ambiguidades suficientes para que as fotos originais da verdade do solo sejam muito preferíveis.
O GAN é limitado pela biblioteca de treinamento disponível - não funcionará bem se você tentar gerar imagens fora do escopo de seus dados de treinamento. Os resultados mostrados no trabalho de pesquisa focam no domínio fornecido pelos dados de treinamento. Mas você não pode simplesmente alimentar nenhuma frase nesse modelo e esperar um resultado que seria útil em outro lugar.
Se você encontrar um GAN treinado em um conjunto de dados adequado para o seu problema, provavelmente será melhor tentar obter os mesmos dados diretamente para o seu projeto.
Se você estiver enfrentando um problema com dados limitados da verdade do solo, talvez uma abordagem melhor para usar uma GAN seja o uso de um classificador pré-treinado, como o VGG-19 ou o Inception v5, substitua as últimas camadas totalmente conectadas e sintonize-o nos seus dados. Aqui está um exemplo de como fazer isso usando a biblioteca Keras em Python - outros exemplos podem ser encontrados em pesquisas como "ajuste fino do classificador de imagem CNN".
* Os GANs de última geração melhoraram desde que publiquei esta resposta. Uma equipe de pesquisa da Nvidia teve um sucesso notável ao criar imagens foto-realísticas de 1024x1024 . No entanto, isso não altera os outros pontos da minha resposta. Os GANs não são uma fonte confiável de imagens para tarefas de classificação de imagens, exceto talvez para subtarefas do que o GAN já foi treinado e é capaz de gerar condicionalmente (ou talvez mais trivialmente, para fornecer dados de origem para "outras" categorias em classificadores).