Estatísticas e Big Data

2

ImageNet: qual é a taxa de erro top 1 e 5?

Nos documentos de classificação da ImageNet, as taxas de erro 1 e 5 são unidades importantes para medir o sucesso de algumas soluções, mas quais são essas taxas? Na classificação ImageNet com redes neurais profundas convolucionais por Krizhevsky et al. todas as soluções baseadas em uma única CNN (página 7) …

38 classification neural-networks error measurement-error image-processing

3

O PCA funcionaria para tipos de dados booleanos (binários)?

Quero reduzir a dimensionalidade dos sistemas de ordem superior e capturar a maior parte da covariância em um campo de preferência bidimensional ou unidimensional. Entendo que isso pode ser feito por meio da análise de componentes principais e usei o PCA em muitos cenários. No entanto, nunca o usei com …

38 pca data-visualization binary-data dimensionality-reduction correspondence-analysis

2

É incomum que o MEAN supere o ARIMA?

Recentemente, apliquei uma variedade de métodos de previsão (MEAN, RWF, ETS, ARIMA e MLPs) e constatei que MEAN se saiu surpreendentemente bem. (MEAN: onde todas as previsões futuras são previstas como sendo iguais à média aritmética dos valores observados.) MEAN até superou o ARIMA nas três séries que usei. O …

38 forecasting arima

3

Diretriz para selecionar os hiperparâmetros no Deep Learning

Estou procurando um artigo que possa ajudar a fornecer diretrizes sobre como escolher os hiperparâmetros de uma arquitetura profunda, como auto-codificadores empilhados ou redes de crenças profundas. Existem muitos hiperparâmetros e estou muito confuso sobre como escolhê-los. O uso da validação cruzada também não é uma opção, pois o treinamento …

38 machine-learning deep-learning deep-belief-networks hyperparameter

3

Como funciona a aproximação do ponto de sela?

Como funciona a aproximação do ponto de sela? Para que tipo de problema é bom? (Sinta-se à vontade para usar um exemplo ou exemplos específicos a título ilustrativo) Existem desvantagens, dificuldades, coisas a serem observadas ou armadilhas para os incautos?

38 distributions mathematical-statistics mgf saddlepoint-approximation partial-moments

1

Manualmente calculado

Sei que essa é uma Rpergunta bastante específica , mas posso estar pensando na variação proporcional explicada, , incorretamente. Aqui vai.R2R2R^2 Estou tentando usar o Rpacote randomForest. Eu tenho alguns dados de treinamento e dados de teste. Quando encaixo um modelo de floresta aleatório, a randomForestfunção permite inserir novos dados …

38 r correlation predictive-models random-forest r-squared

3

Aprendizagem online vs offline?

Qual é a diferença entre aprendizado offline e online ? É apenas uma questão de aprender sobre todo o conjunto de dados (offline) versus aprender de forma incremental (uma instância de cada vez)? Quais são os exemplos de algoritmos usados em ambos?

38 machine-learning online

3

Aplique incorporações de palavras em todo o documento, para obter um vetor de recurso

Como uso uma incorporação de palavras para mapear um documento para um vetor de recurso, adequado para uso com aprendizado supervisionado? Uma incorporação de palavra mapeia cada palavra para um vetor , onde é um número não muito grande (por exemplo, 500). Os casamentos populares de palavras incluem word2vec e …

38 classification natural-language supervised-learning word2vec word-embeddings

4

O que é invariância da tradução na visão computacional e na rede neural convolucional?

Não tenho experiência em visão computacional, mas quando leio alguns artigos e artigos relacionados a processamento de imagens e redes neurais convolucionais, enfrento constantemente o termo translation invariance, ou translation invariant. Ou eu li muito que a operação de convolução fornece translation invariance? !! O que isto significa? Eu mesmo …

38 machine-learning conv-neural-network convolution computer-vision

2

Testes A / B: teste z vs teste t vs qui quadrado vs teste exato de fisher

Estou tentando entender o raciocínio escolhendo uma abordagem de teste específica ao lidar com um teste A / B simples - (ou seja, duas variações / grupos com uma resposta binária (convertida ou não) .Como exemplo, usarei os dados abaixo Version Visits Conversions A 2069 188 B 1826 220 A …

38 statistical-significance chi-squared p-value fishers-exact z-statistic

3

Quais são as diferenças entre 'época', 'lote' e 'minibatch'?

Até onde eu sei, ao adotar a descida do gradiente estocástico como algoritmo de aprendizado, alguém usa 'época' para o conjunto de dados completo e 'lote' para dados usados em uma única etapa de atualização, enquanto outro usa 'lote' e 'minibatch' respectivamente, e os outros usam 'época' e 'minibatch'. Isso …

38 machine-learning

1

Análise de PCA e Correspondência em relação ao Biplot

Biplot é frequentemente usado para exibir resultados da análise de componentes principais (e de técnicas relacionadas). É um gráfico de dispersão duplo ou de sobreposição que mostra as cargas dos componentes e as pontuações dos componentes simultaneamente. Fui informado por @amoeba hoje que ele deu uma resposta que parte do …

38 pca multivariate-analysis svd correspondence-analysis biplot

3

Número aleatório Set.seed (N) em R [duplicado]

Esta pergunta já tem uma resposta aqui: O que exatamente é uma semente em um gerador de números aleatórios? 3 respostas Percebo que se usa set.seed()em R para geração de números pseudo-aleatórios. Também percebo que usar o mesmo número, como set.seed(123)garante que você possa reproduzir resultados. Mas o que não …

38 r random-generation

3

Derivar variância do coeficiente de regressão na regressão linear simples

Na regressão linear simples, temos , onde . Eu o estimador: onde e são os meios de exemplo de e .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Agora eu quero encontrar …

38 regression mathematical-statistics variance linear-model regression-coefficients

2

Interpretação da saída de R para regressão binomial

Sou bastante novo nisso com testes de dados binomiais, mas precisava fazer um e agora não tenho certeza de como interpretar o resultado. A variável y, a variável resposta, é binomial e os fatores explicativos são contínuos. Isto é o que recebi ao resumir o resultado: glm(formula = leaves.presence ~ …

38 r regression logistic binomial interpretation