Eu preciso para se ajustar RandomForestRegressor
a partir sklearn.ensemble
.
forest = ensemble.RandomForestRegressor(**RF_tuned_parameters)
model = forest.fit(train_fold, train_y)
yhat = model.predict(test_fold)
Este código sempre funcionou até que eu fiz algum pré-processamento de dados ( train_y
). A mensagem de erro diz:
DataConversionWarning: Um vetor de coluna y foi passado quando uma matriz 1d era esperada. Altere a forma de y para (n_samples,), por exemplo, usando ravel ().
model = forest.fit (train_fold, train_y)
Anteriormente train_y
era uma série, agora é uma matriz numpy (é um vetor coluna). Se eu aplicar train_y.ravel()
, ele se torna um vetor linha e nenhuma mensagem de erro aparece, através da etapa de predição leva muito tempo (na verdade, nunca termina ...).
Na documentação de RandomForestRegressor
achei que train_y
deveria ser definido como y : array-like, shape = [n_samples] or [n_samples, n_outputs]
Alguma ideia de como resolver esse problema?
train_y
dados para garantir que o pré-processamento não os corrompeu?
RF_tuned_parameters
para nós, por favor.
train_fold.shape
etrain_y.shape
?