Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



2
É incomum que o MEAN supere o ARIMA?
Recentemente, apliquei uma variedade de métodos de previsão (MEAN, RWF, ETS, ARIMA e MLPs) e constatei que MEAN se saiu surpreendentemente bem. (MEAN: onde todas as previsões futuras são previstas como sendo iguais à média aritmética dos valores observados.) MEAN até superou o ARIMA nas três séries que usei. O …

3
Diretriz para selecionar os hiperparâmetros no Deep Learning
Estou procurando um artigo que possa ajudar a fornecer diretrizes sobre como escolher os hiperparâmetros de uma arquitetura profunda, como auto-codificadores empilhados ou redes de crenças profundas. Existem muitos hiperparâmetros e estou muito confuso sobre como escolhê-los. O uso da validação cruzada também não é uma opção, pois o treinamento …


1
Manualmente calculado
Sei que essa é uma Rpergunta bastante específica , mas posso estar pensando na variação proporcional explicada, , incorretamente. Aqui vai.R2R2R^2 Estou tentando usar o Rpacote randomForest. Eu tenho alguns dados de treinamento e dados de teste. Quando encaixo um modelo de floresta aleatório, a randomForestfunção permite inserir novos dados …

3
Aprendizagem online vs offline?
Qual é a diferença entre aprendizado offline e online ? É apenas uma questão de aprender sobre todo o conjunto de dados (offline) versus aprender de forma incremental (uma instância de cada vez)? Quais são os exemplos de algoritmos usados ​​em ambos?

3
Aplique incorporações de palavras em todo o documento, para obter um vetor de recurso
Como uso uma incorporação de palavras para mapear um documento para um vetor de recurso, adequado para uso com aprendizado supervisionado? Uma incorporação de palavra mapeia cada palavra para um vetor , onde é um número não muito grande (por exemplo, 500). Os casamentos populares de palavras incluem word2vec e …

4
O que é invariância da tradução na visão computacional e na rede neural convolucional?
Não tenho experiência em visão computacional, mas quando leio alguns artigos e artigos relacionados a processamento de imagens e redes neurais convolucionais, enfrento constantemente o termo translation invariance, ou translation invariant. Ou eu li muito que a operação de convolução fornece translation invariance? !! O que isto significa? Eu mesmo …


3
Quais são as diferenças entre 'época', 'lote' e 'minibatch'?
Até onde eu sei, ao adotar a descida do gradiente estocástico como algoritmo de aprendizado, alguém usa 'época' para o conjunto de dados completo e 'lote' para dados usados ​​em uma única etapa de atualização, enquanto outro usa 'lote' e 'minibatch' respectivamente, e os outros usam 'época' e 'minibatch'. Isso …


3
Número aleatório Set.seed (N) em R [duplicado]
Esta pergunta já tem uma resposta aqui: O que exatamente é uma semente em um gerador de números aleatórios? 3 respostas Percebo que se usa set.seed()em R para geração de números pseudo-aleatórios. Também percebo que usar o mesmo número, como set.seed(123)garante que você possa reproduzir resultados. Mas o que não …

3
Derivar variância do coeficiente de regressão na regressão linear simples
Na regressão linear simples, temos , onde . Eu o estimador: onde e são os meios de exemplo de e .y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + uu∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2)β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , x¯x¯\bar{x}y¯y¯\bar{y}xxxyyy Agora eu quero encontrar …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.