Primeiro de tudo, temos uma tarefa de classificação.
Portanto, usamos a entropia cruzada softmax típica para classificar.
A implementação atual da aprendizagem curricular é a seguinte.
- Primeiro treinamos nossa melhor versão da rede neural
- Na última época, obtemos todas as entropias cruzadas para todas as instâncias. Portanto, entropias cruzadas menores são melhor classificadas e maiores não tão bem.
- Em seguida, classificamos as instâncias com base nas entropias cruzadas.
- Começamos a treinar as instâncias de mais fácil a mais difícil, como sugere a teoria do aprendizado do currículo
Observe que já experimentamos várias etapas e repetições. Assim, em um exemplo, pegamos os primeiros 200 lotes e os treinamos duas vezes antes de ir para o próximo lote e assim sucessivamente até que uma época seja concluída.
Em outro exemplo, pegamos os 10 primeiros lotes e os treinamos apenas uma vez e depois os 10 e 10 seguintes e assim sucessivamente até o final da época.
Todas as experiências até agora concluíram que a rede neural tem uma precisão relativamente boa no início e isso piora à medida que surgem as situações mais difíceis. A precisão final é muito pior do que o esperado e, além disso, a precisão máxima ainda é bastante ruim.
Por que esse aprendizado curricular não está funcionando? Falta alguma coisa?