Perguntas com a marcação «scikit-learn»

Uma biblioteca de aprendizado de máquina para Python. Use essa tag para qualquer pergunta no tópico que (a) envolva o scikit-learn como parte crítica da pergunta ou resposta esperada, & (b) não seja apenas sobre como usar o scikit-learn.

3
O XGBoost x o Python Sklearn aumentaram as árvores
Estou tentando entender como o XGBoost funciona. Eu já entendo como as árvores com gradiente aumentado funcionam no sklearn do Python. O que não está claro para mim é se o XGBoost funciona da mesma maneira, mas mais rápido, ou se existem diferenças fundamentais entre ele e a implementação do …

2
Métricas de classificação de vários rótulos no scikit
Estou tentando criar um classificador de várias etiquetas para atribuir tópicos a documentos existentes usando o scikit Estou processando meus documentos passando-os TfidfVectorizerpelos rótulos MultiLabelBinarizere criando um OneVsRestClassifiercom um SGDClassifiercomo estimador. No entanto, ao testar meu classificador, apenas recebo pontuações de 0,29, o que pelo que li é bastante baixo …

2
A floresta aleatória está super ajustada?
Estou experimentando florestas aleatórias com o scikit-learn e estou obtendo ótimos resultados do meu conjunto de treinamento, mas resultados relativamente ruins no meu conjunto de testes ... Aqui está o problema (inspirado no poker) que estou tentando resolver: Dadas as cartas do jogador A, as cartas do jogador B e …

3
Como calcular os erros padrão dos coeficientes de uma regressão logística
Estou usando o scikit-learn do Python para treinar e testar uma regressão logística. O scikit-learn retorna os coeficientes da regressão das variáveis ​​independentes, mas não fornece os erros padrão dos coeficientes. Eu preciso desses erros padrão para calcular uma estatística de Wald para cada coeficiente e, por sua vez, comparar …

3
Por que não usar as "equações normais" para encontrar coeficientes simples de mínimos quadrados?
Eu vi essa lista aqui e não podia acreditar que havia tantas maneiras de resolver mínimos quadrados. As "equações normais" na Wikipedia pareciam ser um caminho bastante direto: α^β^=y¯−β^x¯,=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯−β^x¯,β^=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2 {\displaystyle {\begin{aligned}{\hat {\alpha }}&={\bar {y}}-{\hat {\beta }}\,{\bar {x}},\\{\hat {\beta }}&={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}\end{aligned}}} Então, por que não usá-los? …






3
Regressão logística: Scikit Learn vs glmnet
Estou tentando duplicar os resultados da sklearnbiblioteca de regressão logística usando o glmnetpacote em R. A partir da documentação dasklearn regressão logística , ele está tentando minimizar a função de custo sob pena de l2 min w , c 1minw , c12WTw + C∑i = 1Nregistro( exp( - yEu( XTEuw …

3
Métodos para solucionar o problema de falta de dados no aprendizado de máquina
Praticamente qualquer banco de dados que desejamos fazer previsões usando algoritmos de aprendizado de máquina encontrará valores ausentes para algumas das características. Existem várias abordagens para resolver esse problema, para excluir linhas que possuem valores ausentes até que sejam preenchidas com os valores médios das características. Gostaria de usar para …


2
Scikit maneira correta de calibrar classificadores com CalibratedClassifierCV
O Scikit possui o CalibratedClassifierCV , que permite calibrar nossos modelos em um par X, y específico. Também afirma claramente quedata for fitting the classifier and for calibrating it must be disjoint. Se eles devem ser desarticulados, é legítimo treinar o classificador com o seguinte? model = CalibratedClassifierCV(my_classifier) model.fit(X_train, y_train) …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.