Perguntas com a marcação «machine-learning»

Os algoritmos de aprendizado de máquina constroem um modelo dos dados de treinamento. O termo "aprendizado de máquina" é vagamente definido; inclui o que também é chamado aprendizado estatístico, aprendizado reforçado, aprendizado não supervisionado etc. SEMPRE ADICIONE UM TAG MAIS ESPECÍFICO.

2
Sobre a "força" de alunos fracos
Eu tenho várias perguntas relacionadas a alunos fracos na aprendizagem de grupos (por exemplo, impulsionar). Isso pode parecer idiota, mas quais são os benefícios de usar alunos fracos em oposição a alunos fortes? (por exemplo, por que não aumentar com métodos de aprendizado "fortes"?) Existe algum tipo de força "ideal" …




2
Escolhendo o alfa ideal na regressão logística líquida elástica
Estou executando uma regressão logística de rede elástica em um conjunto de dados de assistência médica usando o glmnetpacote em R selecionando valores lambda em uma grade de de 0 a 1. Meu código abreviado está abaixo:αα\alpha alphalist <- seq(0,1,by=0.1) elasticnet <- lapply(alphalist, function(a){ cv.glmnet(x, y, alpha=a, family="binomial", lambda.min.ratio=.001) }) …

3
Por que Lars e Glmnet oferecem soluções diferentes para o problema do laço?
Eu quero entender melhor os pacotes R Larse Glmnet, que são usados ​​para resolver o problema de Lasso: (parapVariáveis ​​eamostras deN, consultewww.stanford.edu/~hastie/Papers/glmnet.pdfna página 3)m i n( β0 0β) ∈ Rp + 1[ 12 N∑i = 1N( yEu- β0 0- xTEuβ)2+ λ | | β| |eu1]mEun(β0 0β)∈Rp+1[12N∑Eu=1N(yEu-β0 0-xEuTβ)2+λ||β||eu1]min_{(\beta_0 \beta) \in R^{p+1}} …

8
Execute o agrupamento K-means (ou seus parentes próximos) com apenas uma matriz de distância, não dados de pontos por recurso
Quero executar o agrupamento K-means nos objetos que tenho, mas os objetos não são descritos como pontos no espaço, ou seja, por objects x featuresconjunto de dados. No entanto, sou capaz de calcular a distância entre dois objetos (ela se baseia em uma função de similaridade). Então, eu descarto a …


2
Quando devemos discretizar / classificar variáveis ​​/ recursos independentes contínuos e quando não devemos?
Quando devemos discretizar / bin variáveis ​​/ recursos independentes e quando não devemos? Minhas tentativas de responder à pergunta: Em geral, não devemos fazer bin, porque o binning perderá informações. Na verdade, o binning está aumentando o grau de liberdade do modelo; portanto, é possível causar um ajuste excessivo após …


4
Os algoritmos de Machine Learning ou Deep Learning podem ser utilizados para "melhorar" o processo de amostragem de uma técnica de MCMC?
Com base no pouco conhecimento que tenho dos métodos MCMC (cadeia de Markov Monte Carlo), entendo que a amostragem é uma parte crucial da técnica mencionada acima. Os métodos de amostragem mais comumente usados ​​são Hamiltoniano e Metrópole. Existe uma maneira de utilizar o aprendizado de máquina ou mesmo o …




2
Técnicas de aumento de dados para conjuntos de dados gerais?
Em muitas aplicações de aprendizado de máquina, os chamados métodos de aumento de dados permitiram construir modelos melhores. Por exemplo, assuma um conjunto de treinamento de imagens de cães e gatos. Girando, espelhando, ajustando o contraste, etc., é possível gerar imagens adicionais a partir das originais.100100100 No caso de imagens, …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.