Treinei um modelo de previsão com o Scikit Learn em Python (Random Forest Regressor) e quero extrair de alguma forma os pesos de cada recurso para criar uma ferramenta de excel para previsão manual.
A única coisa que encontrei é a model.feature_importances_
mas não ajuda.
Existe alguma maneira de conseguir isso?
def performRandomForest(X_train, y_train, X_test, y_test):
'''Perform Random Forest Regression'''
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit( X_train , y_train )
#make predictions
expected = y_test
predicted = model.predict( X_test )
#summarize the fit of the model
mse = np.mean(( predicted - expected )** 2)
accuracy = ( model.score ( X_train , y_train ))
return model, mse, accuracy
No momento, eu uso o model.predict([features])
para fazê-lo, mas preciso em um arquivo do Excel.
decision trees
, portanto, você não obterá uma equação como a regressão linear. Em vez disso, você terá um monte deif, then, else
lógica e muitas equações finais para transformar as folhas finais em valores numéricos. Mesmo se você puder visualizar a árvore e retirar toda a lógica, tudo isso parece uma grande bagunça. Se você estiver trabalhando no Excel, talvez pense em apenas treinar seu modelo no Excel usando o Azure. No entanto, eu provavelmente chamaria o python no excel.