Perguntas com a marcação «machine-learning»

Os algoritmos de aprendizado de máquina constroem um modelo dos dados de treinamento. O termo "aprendizado de máquina" é vagamente definido; inclui o que também é chamado aprendizado estatístico, aprendizado reforçado, aprendizado não supervisionado etc. SEMPRE ADICIONE UM TAG MAIS ESPECÍFICO.


2
Como escolher os tamanhos de conjunto de treinamento, validação cruzada e teste para pequenos dados de tamanho de amostra?
Suponha que eu tenha um tamanho pequeno de amostra, por exemplo, N = 100 e duas classes. Como devo escolher os tamanhos de treinamento, validação cruzada e conjunto de testes para aprendizado de máquina? Eu escolheria intuitivamente Tamanho do conjunto de treinamento como 50 Conjunto de validação cruzada tamanho 25 …

1
Interpretação da área sob a curva PR
Atualmente, estou comparando três métodos e tenho a Precisão, auROC e auPR como métricas. E eu tenho os seguintes resultados: Método A - acc: 0,75, auROC: 0,75, auPR: 0,45 Método B - acc: 0,65, auROC: 0,55, auPR: 0,40 Método C - acc: 0,55, auROC: 0,70, auPR: 0,65 Eu tenho um …

2
Quais são as boas métricas para avaliar a qualidade de um ajuste de PCA, a fim de selecionar o número de componentes?
Qual é uma boa métrica para avaliar a qualidade da análise de componentes principais (PCA)? Eu executei esse algoritmo em um conjunto de dados. Meu objetivo era reduzir o número de recursos (a informação era muito redundante). Sei que a porcentagem de variação mantida é um bom indicador da quantidade …



1
Comparação de CPH, modelo de tempo de falha acelerado ou redes neurais para análise de sobrevivência
Eu sou novo na análise de sobrevivência e aprendi recentemente que existem diferentes maneiras de fazer isso, com um determinado objetivo. Estou interessado na implementação real e na adequação desses métodos. Fui apresentado aos tradicionais Riscos Proporcionais de Cox , modelos de tempos de falha acelerados e redes neurais (perceptron …


1
Árvores de decisão dimensionamento variável (recurso) e normalização variável (ajuste) necessários em quais implementações?
Em muitos algoritmos de aprendizado de máquina, dimensionamento recurso (aka variável de escala, normalização) é um comum prepocessing passo Wikipedia - função Dimensionamento - esta questão estava perto Pergunta # 41704 - Como e por que a normalização e operação de referência de escala? Eu tenho duas perguntas especificamente em …

6
Modelos flexíveis e inflexíveis no aprendizado de máquina
Me deparei com uma pergunta simples sobre a comparação de modelos flexíveis (ou seja, splines) versus modelos inflexíveis (por exemplo, regressão linear) em diferentes cenários. A questão é: Em geral, esperamos que o desempenho de um método flexível de aprendizado estatístico tenha um desempenho melhor ou pior que um método …

4
Convergência de pesos de redes neurais
Cheguei a uma situação em que os pesos da minha rede neural não estão convergindo, mesmo após 500 iterações. Minha rede neural contém 1 camada de entrada, 1 camada oculta e 1 camada de saída. São cerca de 230 nós na camada de entrada, 9 nós na camada oculta e …

3
Como obter um intervalo de confiança na mudança do quadrado da população
Para um exemplo simples, assuma que existem dois modelos de regressão linear Modelo 1 tem três preditores, x1a, x2b, ex2c O modelo 2 possui três preditores do modelo 1 e dois preditores adicionais x2aex2b Existe uma equação de regressão populacional em que a variação populacional explicada é para o Modelo …

1
Como incorporar um outlier inovador na observação 48 no meu modelo ARIMA?
Estou trabalhando em um conjunto de dados. Depois de usar algumas técnicas de identificação de modelos, criei um modelo ARIMA (0,2,1). Usei a detectIOfunção no pacote TSAem R para detectar um outlier inovador (IO) na 48ª observação do meu conjunto de dados original. Como faço para incorporar esse erro externo …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


1
Estatísticas para aprendizado de máquina, documentos para começar?
Tenho formação em programação de computadores e teoria elementar dos números, mas não tenho treinamento em estatística real, e recentemente "descobri" que o incrível mundo de toda uma gama de técnicas é realmente um mundo estatístico. Parece que fatorações matriciais, conclusão matricial, tensores de alta dimensão, incorporação, estimativa de densidade, …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.