como o GAN consiste em duas partes - o gerador e o discriminador, existem duas maneiras de usar o GAN como extrator de recursos:
- Maneira baseada em gerador, como apresentado por Mikhail Yurasov.
- Maneira baseada no discriminador, como apresentado por Kenny.
A segunda maneira é mais controversa. Alguns estudos [1] pensaram que, intuitivamente, como o alvo do discriminador é distinguir as amostras geradas das amostras reais, ele se concentrará apenas na diferença entre esses dois tipos de amostras. Mas o que faz sentido é a diferença entre amostras reais, que são as amostras usadas pelas tarefas posteriores.
Tentei estudar isso e descobri que o recurso extraído pode ser fatorado em dois subespaços ortogonais . O primeiro espaço contribui para a tarefa discriminadora, enquanto o segundo está livre dele. Como na maioria dos casos, os recursos usados para distinguir as amostras reais das geradas são ruído, o segundo espaço de recurso será livre de ruído. Nessa perspectiva, embora a tarefa do discriminador não se concentre na diferença entre amostras reais, que são úteis para as tarefas posteriores, os recursos sem ruído contidos no segundo subespaço funcionarão.
[1] Jost Tobias Springenberg. Aprendizagem não supervisionada e semi-supervisionada com redes adversas generativas categóricas. arXiv: 1511.06390 [cs, stat], abril de 2016. pré-impressão do arXiv. arXiv: 1511.06390 [stat.ML]. Ithaca, NY: Biblioteca da Universidade de Cornell.