Perguntas com a marcação «scikit-learn»

scikit-learn é uma biblioteca de aprendizado de máquina para Python que fornece ferramentas simples e eficientes para análise e mineração de dados, com foco no aprendizado de máquina. É acessível a todos e reutilizável em vários contextos. Ele é baseado em NumPy e SciPy. O projeto é open source e comercialmente utilizável (licença BSD).

3
Python - o que é exatamente sklearn.pipeline.Pipeline?
Não consigo descobrir como sklearn.pipeline.Pipelinefunciona exatamente. Existem algumas explicações no documento . Por exemplo, o que eles querem dizer com: Pipeline de transformações com um estimador final. Para deixar minha pergunta mais clara, quais são steps? Como eles funcionam? Editar Graças às respostas, posso deixar minha pergunta mais clara: Quando …

13
ImportError na importação de sklearn: não é possível importar o nome check_build
Estou recebendo o seguinte erro ao tentar importar do sklearn: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build Estou usando o python 2.7, …

8
Um vetor-coluna y foi passado quando uma matriz 1d era esperada
Eu preciso para se ajustar RandomForestRegressora partir sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Este código sempre funcionou até que eu fiz algum pré-processamento de dados ( train_y). A mensagem de erro diz: DataConversionWarning: Um vetor de coluna y foi passado quando uma matriz 1d era …

2
Como funciona o parâmetro class_weight no scikit-learn?
Estou tendo muitos problemas para entender como funciona o class_weightparâmetro na regressão logística do scikit-learn. A situação Quero usar a regressão logística para fazer a classificação binária em um conjunto de dados muito desequilibrado. As classes são rotuladas 0 (negativo) e 1 (positivo) e os dados observados estão em uma …








5
Parâmetro “estratificar” do método “train_test_split” (scikit Learn)
Estou tentando usar train_test_splitdo pacote scikit Learn, mas estou tendo problemas com o parâmetro stratify. A seguir está o código: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) No entanto, continuo tendo o seguinte problema: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters passed: …

3
RandomForestClassifier vs ExtraTreesClassifier no scikit learn
Alguém pode explicar a diferença entre o RandomForestClassifier e ExtraTreesClassifier no scikit learn. Passei um bom tempo lendo o jornal: P. Geurts, D. Ernst., E L. Wehenkel, "árvores extremamente aleatórias", Machine Learning, 63 (1), 3-42, 2006 Parece que essas são as diferenças para ET: 1) Ao escolher variáveis ​​em uma …


7
Treino estratificado / divisão de teste no scikit-learn
Preciso dividir meus dados em um conjunto de treinamento (75%) e um conjunto de teste (25%). Atualmente faço isso com o código abaixo: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) No entanto, gostaria de estratificar meu conjunto de dados de treinamento. Como faço isso? Estive examinando o StratifiedKFoldmétodo, mas não …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.