Detalhes:
GPU : GTX 1080
Treinamento : ~ 1,1 milhão de imagens pertencentes a 10 classes
Validação : ~ 150 mil imagens pertencentes a 10 classes
Tempo por época : ~ 10 horas
Eu configurei CUDA, cuDNN e Tensorflow (GPU Tensorflow também).
Eu não acho que meu modelo é tão complicado que leva 10 horas por época. Até chequei se minha GPU era o problema, mas não era.
O tempo de treinamento é devido às camadas totalmente conectadas?
Meu modelo:
model = Sequential()
model.add()
model.add(Conv2D(64, (3, 3), padding="same", strides=2))
model.add(Activation('relu'))
model.add(Dropout(0.25))
model.add(Conv2D(64, (3, 3), padding="same", strides=2))
model.add(Activation('relu'))
model.add(Dropout(0.25))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(3, 3), strides=2))
model.add(Flatten())
model.add(Dense(256))
model.add(Activation('relu'))
model.add(Dense(4096))
model.add(Activation('relu'))
model.add(Dense(10))
model.add(Activation('softmax'))
model.summary()
opt = keras.optimizers.rmsprop(lr=0.0001, decay=1e-6)
model.compile(loss='categorical_crossentropy',
optimizer=opt,
metrics=['accuracy']
)
Como existem muitos dados, usei o ImageDataGenerator.
gen = ImageDataGenerator(
horizontal_flip=True
)
train_gen = gen.flow_from_directory(
'train/',
target_size=(512, 512),
batch_size=5,
class_mode="categorical"
)
valid_gen = gen.flow_from_directory(
'validation/',
target_size=(512, 512),
batch_size=5,
class_mode="categorical"
)