Perguntas com a marcação «scikit-learn»

Uma biblioteca de aprendizado de máquina para Python. Use essa tag para qualquer pergunta no tópico que (a) envolva o scikit-learn como parte crítica da pergunta ou resposta esperada, & (b) não seja apenas sobre como usar o scikit-learn.


1
As florestas aleatórias podem fazer muito melhor que o erro de teste de 2,8% no MNIST?
Não encontrei nenhuma literatura sobre a aplicação de florestas aleatórias no MNIST, CIFAR, STL-10, etc., então pensei em experimentá-las com o MNIST invariante, permutador . Em R , tentei: randomForest(train$x, factor(train$y), test$x, factor(test$y), ntree=500) Isso foi executado por 2 horas e ocorreu um erro de teste de 2,8%. Eu também …




2
O estado aleatório é um parâmetro para ajustar?
Um problema que ocorre com frequência em meus experimentos é que o modelo varia no desempenho quando o estado aleatório do algoritmo é alterado. Portanto, a pergunta é simples, devo tomar o estado aleatório como um hiperparâmetro? Por que é que? Se meu modelo supera outras pessoas com diferentes estados …

2
Como preparar interações de variáveis ​​categóricas no scikit-learn?
Qual é a melhor maneira de preparar interações de recursos categóricos antes de se adaptar ao scikit-learn? Com statsmodelseu poderia dizer convenientemente em estilo R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(o mesmo em Stata com regress depvar i.var1##i.var2). Pode sklearn.preprocessing.PolynomialFeatures(na v0.15, atualmente dev) ser usado com variáveis ​​categóricas?






1
Regressão linear minimizando MAD no sklearn
A classe de regressão linear sklearn padrão encontra uma relação linear aproximada entre variável e covariável que minimiza o erro quadrado médio (MSE). Especificamente, seja o número de observações e vamos ignorar a interceptação por simplicidade. Seja o valor variável da ésima observação e sejam os valores das covariáveis ​​da …

1
Algoritmo de classificação com base nas distâncias médias de um ponto de teste aos pontos de cada classe
Existe algum algoritmo de classificação que atribua um novo vetor de teste ao cluster de pontos cuja distância média é mínima? Deixe-me escrever melhor: vamos imaginar que temos KKK aglomerados de TkTkT_kaponta cada. Para cada cluster k, calculo a média de todas as distâncias entrex(0)x(0)x(0) e x(i)x(i)x(i), Onde x(i)x(i)x(i) é …

2
Pena de laço aplicada apenas ao subconjunto de regressores
Esta pergunta já foi feita antes, mas não houve respostas, então pensei em perguntar novamente. Estou interessado em aplicar uma penalidade de laço a algum subconjunto dos regressores, ou seja, com função objetivo E=||y−X1β1−X2β2||2+λ||β1||1E=||y−X1β1−X2β2||2+λ||β1||1E = ||\mathbf{y} - \mathbf{X}_1 \boldsymbol{\beta}_1 - \mathbf{X}_2 \boldsymbol{\beta}_2||^2 + \lambda ||\boldsymbol{\beta}_1||_1 onde o Lasso é aplicado …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.