Estatísticas e Big Data train

5

Tamanho do lote de troca versus número de iterações para treinar uma rede neural

Ao treinar uma rede neural, que diferença faz para definir: tamanho do lote para e o número de iterações paraumaumaabbb vs. tamanho do lote em número de iterações emcccddd onde ?a b = c dumab=cd ab = cd Em outras palavras, assumindo que treinamos a rede neural com a mesma …

222 neural-networks train

1

Benefícios da amostragem estratificada vs aleatória para gerar dados de treinamento na classificação

Gostaria de saber se existem / algumas vantagens em usar amostragem estratificada em vez de aleatória, ao dividir o conjunto de dados original em conjunto de treinamento e teste para classificação. Além disso, a amostragem estratificada introduz mais viés no classificador do que a amostragem aleatória? O aplicativo, para o …

20 classification cross-validation random-forest train stratification

3

Imputação antes ou depois da divisão no trem e no teste?

Eu tenho um conjunto de dados com N ~ 5000 e faltando cerca de 1/2 em pelo menos uma variável importante. O principal método analítico serão os riscos proporcionais de Cox. Eu pretendo usar várias imputações. Também estarei me dividindo em um trem e um conjunto de testes. Devo dividir …

18 cross-validation survival multiple-imputation train

4

A precisão da máquina de aumento de gradiente diminui à medida que o número de iterações aumenta

Estou experimentando o algoritmo da máquina de aumento de gradiente através do caretpacote em R. Usando um pequeno conjunto de dados de admissões de faculdade, executei o seguinte código: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

2

Resultados diferentes do randomForest via acento circunflexo e do pacote randomForest básico

Estou um pouco confuso: como os resultados de um modelo treinado via sinal de intercalação diferem do modelo na embalagem original? Eu li se o pré-processamento é necessário antes da previsão usando o FinalModel do RandomForest com pacote de interpolação? mas eu não uso nenhum pré-processamento aqui. Treinei diferentes florestas …

14 r machine-learning random-forest caret train

3

Treinamento, teste, validação de um problema de análise de sobrevivência

Estive navegando em vários tópicos aqui, mas não acho que minha pergunta exata seja respondida. Eu tenho um conjunto de dados de ~ 50.000 alunos e seu tempo para desistir. Vou realizar uma regressão proporcional a riscos com um grande número de covariáveis em potencial. Também farei regressão logística na …

14 cross-validation survival train

2

Scikit maneira correta de calibrar classificadores com CalibratedClassifierCV

O Scikit possui o CalibratedClassifierCV , que permite calibrar nossos modelos em um par X, y específico. Também afirma claramente quedata for fitting the classifier and for calibrating it must be disjoint. Se eles devem ser desarticulados, é legítimo treinar o classificador com o seguinte? model = CalibratedClassifierCV(my_classifier) model.fit(X_train, y_train) …

14 cross-validation scikit-learn validation train calibration

1

Como saber se uma curva de aprendizado do modelo SVM sofre viés ou variância?

Criei essa curva de aprendizado e quero saber se meu modelo SVM sofre de viés ou variação? Como posso concluir isso a partir deste gráfico?

12 machine-learning svm bias train

4

Bons exemplos / livros / recursos para aprender sobre o aprendizado de máquina aplicado (não apenas o próprio ML)

Eu fiz um curso de ML anteriormente, mas agora que estou trabalhando com projetos relacionados ao ML no meu trabalho, estou lutando bastante para realmente aplicá-lo. Tenho certeza de que o que estou fazendo já foi pesquisado / tratado antes, mas não consigo encontrar tópicos específicos. Todos os exemplos de …

11 machine-learning references train application

3

Abordagens ao aprender com grandes conjuntos de dados?

Basicamente, existem duas maneiras comuns de aprender com grandes conjuntos de dados (quando você se depara com restrições de tempo / espaço): Trapaça :) - use apenas um subconjunto "gerenciável" para treinamento. A perda de precisão pode ser insignificante por causa da lei dos retornos decrescentes - o desempenho preditivo …

10 machine-learning large-data model-evaluation train

1

Como o AIC ou o BIC podem ser usados em vez da divisão trem / teste?

Recentemente, encontrei várias fontes "informais" que indicam que, em algumas circunstâncias, se usarmos o AIC ou o BIC para treinar um modelo de série temporal, não precisaremos dividir os dados em teste e treinamento - podemos usar todos os dados para treinamento. (As fontes incluem, entre outras, uma discussão no …

8 time-series cross-validation aic train bic

6

O uso dos mesmos dados para seleção de recurso e validação cruzada é tendencioso ou não?

Temos um pequeno conjunto de dados (cerca de 250 amostras * 100 recursos) no qual queremos criar um classificador binário após selecionar o melhor subconjunto de recursos. Digamos que particionemos os dados em: Treinamento, Validação e Teste Para a seleção de recursos, aplicamos um modelo de wrapper com base na …

8 machine-learning cross-validation feature-selection train

1

Como funciona a validação cruzada no trem (circunflexo)?

Eu li várias postagens sobre o pacote de sinal de intercalação e estou especificamente interessado na função de trem . No entanto, não tenho certeza se entendi corretamente como a função do trem funciona. Para ilustrar meus pensamentos atuais, compus um exemplo rápido. Primeiro, um especifica uma grade de parâmetros. …

8 r cross-validation caret train

3

O modelo com sobreajuste com AUC mais alta na amostra de teste é melhor do que o não com sobreajuste

estou participando de um desafio no qual criei um modelo que executa 70% de AUC no conjunto de trens e 70% de AUC no conjunto de testes de espera. O outro participante criou um modelo que executa 96% de AUC no conjunto de trens e 76% de AUC no conjunto …

7 validation overfitting model-comparison auc train

Perguntas com a marcação «train»