Um estranho para o campo ML / DL; iniciou o curso Udacity Deep Learning, baseado no Tensorflow; fazendo a tarefa 3, problema 4; tentando ajustar a taxa de aprendizado com a seguinte configuração:
- Tamanho do lote 128
- Número de etapas: o suficiente para preencher duas épocas
- Tamanhos de camadas ocultas: 1024, 305, 75
- Inicialização do peso: normal truncado com padrão. desvio de sqrt (2 / n) em que n é o tamanho da camada anterior
- Probabilidade de desistência: 0,75
- Regularização: não aplicada
- Algoritmo de taxa de aprendizagem: decaimento exponencial
brincou com os parâmetros da taxa de aprendizado; eles não parecem ter efeito na maioria dos casos; código aqui ; resultados:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- Como devo ajustar sistematicamente a taxa de aprendizado?
- Como a taxa de aprendizado está relacionada ao número de etapas?