Keras tem uma maneira de extrair os recursos de um modelo pré-treinado, descrito aqui https://keras.io/applications/
from keras.applications.vgg16 import VGG16
from keras.preprocessing import image
from keras.applications.vgg16 import preprocess_input
import numpy as np
model = VGG16(weights='imagenet', include_top=False)
img_path = 'elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)
features = model.predict(x)
Eu tentei isso com algumas imagens de amostra. Meu vetor x tem a forma (100, 3, 224, 224) para 100 observações, 3 para RGB e 224x224 pixels. o preprocess_input
remodelará para o modelo VGG (espera uma ordem diferente).
No entanto, a forma de saída de features
é (100, 512, 7, 7). Qual é essa forma? Eu quero usar os recursos como entrada para uma regressão logística. Então, eu preciso de uma forma como (100, n): uma linha para cada observação e os recursos nas colunas. Como remodelar a saída para esta dimensão?
Digamos que agora eu queira criar meu próprio Convnet simples:
from keras.models import Sequential
from keras.layers import Convolution2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
model = Sequential()
model.add(Convolution2D(32, 3, 3, input_shape=(1, 299, 299)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Convolution2D(32, 3, 3))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Convolution2D(64, 3, 3))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
Este modelo espera imagens em escala de cinza como entrada, daí a forma.
Que tipo de camada devo adicionar para obter recursos desse modelo (algo que eu possa inserir em uma regressão logística ou floresta aleatória).
obrigado