Estatísticas e Big Data feature-construction

2

A Wikipedia fornece o seguinte exemplo ao descrever o hash de recursos ; mas o mapeamento não parece consistente com o dicionário definido Por exemplo, todeve ser convertido para de 3acordo com o dicionário, mas é codificado como 1alternativa. Existe um erro na descrição? Como funciona o hash de recursos? …

10 feature-construction

1

Lidando com conjuntos de dados de séries temporais muito grandes

Eu tenho acesso a um conjunto de dados muito grande. Os dados são de gravações do MEG de pessoas ouvindo trechos musicais, de um dos quatro gêneros. Os dados são os seguintes: 6 Sujeitos 3 Repetições experimentais (épocas) 120 tentativas por época 8 segundos de dados por tentativa a 500Hz …

10 machine-learning feature-selection large-data feature-construction

1

Por que os recursos aleatórios de Fourier não são negativos?

Os recursos aleatórios de Fourier fornecem aproximações às funções do kernel. Eles são usados para vários métodos de kernel, como SVMs e processos gaussianos. Hoje, tentei usar a implementação do TensorFlow e obtive valores negativos para metade dos meus recursos. Pelo que entendi, isso não deveria acontecer. Então, voltei ao …

10 machine-learning kernel-smoothing feature-construction tensorflow fourier-transform

3

Algoritmo de aprendizado de máquina para classificação

Eu tenho um conjunto de elementos que posso descrever de acordo com características. Portanto:XXXnnn xEu: { ceu 1, cEu 2, ... , CEu n} | XEu∈ XxEu:{cEu1 1,cEu2,…,cEun}∣xEu∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X onde é a avaliação (numérica) do elemento acordo com as características . Portanto, meus …

10 machine-learning algorithms ranking feature-construction

6

Como preparar / construir recursos para detecção de anomalias (dados de segurança da rede)

Meu objetivo é analisar os logs de rede (por exemplo, Apache, syslog, auditoria de segurança do Active Directory e assim por diante) usando a detecção de cluster / anomalia para fins de detecção de intrusão. Nos logs, tenho muitos campos de texto como endereço IP, nome de usuário, nome do …

9 feature-selection outliers unsupervised-learning feature-construction

3

a engenharia de recursos é importante ao fazer o Random Forest ou o Gradient Boosting?

Para modelos lineares (como regressão linear, regressão logística, etc.), a engenharia de recursos é uma etapa importante para melhorar o desempenho dos modelos. Minha pergunta é: importa se realizamos alguma engenharia de recursos ao usar floresta aleatória ou aumento de gradiente? Concedido que esses modelos não são modelos de aprendizado …

9 machine-learning random-forest feature-construction gbm boosting

2

Qual a importância da expansão da base para redes profundas?

Se as redes neurais profundas são consideradas aproximadores de funções universais, a expansão de bases é realmente necessária? Ou isso seria específico do caso? Por exemplo, se alguém tiver três variáveis X quantitativas, haveria alguma vantagem em expandir o número de variáveis introduzindo interações, polinômios etc.? Isso parece ter uma …

8 neural-networks deep-learning feature-construction

2

Recurso extraído pelo pool máximo versus pool médio

No aprendizado profundo e na aplicação à visão computacional, é possível dizer que tipo de recursos esses dois tipos de extrato de pooling? Por exemplo, é possível dizer que max pool extrai arestas? Podemos dizer algo semelhante em relação ao agrupamento médio? PS fique à vontade para recomendar se o …

8 machine-learning deep-learning feature-construction computer-vision

1

Codificação de recursos categóricos de alta cardinalidade (várias categorias) quando os recursos diferem bastante na cardinalidade

Estive pesquisando perguntas sobre a codificação de recursos categóricos, mas não encontrei nenhuma que discutisse meu problema. Desculpas se eu perdi. Digamos que temos um conjunto de dados com variáveis binárias e nominais de importância aproximadamente igual cada. A maioria dos classificadores não pode lidar com tipos categóricos diretamente, portanto …

8 classification categorical-data dimensionality-reduction feature-construction many-categories

2

Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?

Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis (id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly spendé a …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

3

Construção de recursos em R

Eu estou querendo saber se existem algoritmos (talvez algoritmos genéticos) em R para construção de recursos (derivados de preditores candidatos de preditores existentes)? Estou pensando em uma rotina para testar potências, interações, proporções e combinações lineares de ordem superior e funções não lineares de variáveis existentes (sin, cos, atan etc.). …

8 r machine-learning feature-construction genetic-algorithms

3

Qual é o papel da engenharia de recursos na inferência estatística?

Esta pode ser uma pergunta idiota. Sou um graduado recente da faculdade que trabalha na área de modelagem preditiva e descobre que há uma forte ênfase na realização de engenharia de recursos. No entanto, na maior parte do meu treinamento acadêmico em estatística, quase não houve menção à engenharia de …

7 inference feature-construction

Perguntas com a marcação «feature-construction»