Ciência de dados

10

Li recentemente Redes totalmente convolucionais para segmentação semântica de Jonathan Long, Evan Shelhamer, Trevor Darrell. Não entendo o que as "camadas desconvolucionais" fazem / como elas funcionam. A parte relevante é 3.3 Upsampling é convolução para trás Outra maneira de conectar saídas grosseiras a pixels densos é a interpolação. Por …

188 neural-network convnet convolution

30

Conjuntos de dados publicamente disponíveis

Um dos problemas comuns na ciência de dados é coletar dados de várias fontes em um formato de alguma forma limpo (semiestruturado) e combinar métricas de várias fontes para fazer uma análise de nível superior. Observando o esforço de outras pessoas, especialmente outras perguntas neste site, parece que muitas pessoas …

168 open-source dataset

13

K-Means clustering para dados numéricos e categóricos mistos

Meu conjunto de dados contém vários atributos numéricos e um categórico. Dizer, NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, onde CategoricalAttrleva um dos três valores possíveis: CategoricalAttrValue1, CategoricalAttrValue2ou CategoricalAttrValue3. Estou usando a implementação padrão do algoritmo de agrupamento k-means para o Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funciona apenas com dados numéricos. Então, minha pergunta: …

133 data-mining clustering octave k-means categorical-data

17

Melhor biblioteca python para redes neurais

Estou usando as Redes Neurais para resolver diferentes problemas de aprendizado de máquina. Estou usando Python e pybrain, mas esta biblioteca está quase descontinuada. Existem outras boas alternativas em Python?

130 machine-learning python neural-network

8

Como definir pesos de classe para classes desequilibradas em Keras?

Eu sei que existe uma possibilidade no Keras com o class_weightsdicionário de parâmetros no ajuste, mas não encontrei nenhum exemplo. Alguém seria tão gentil em fornecer um? A propósito, nesse caso, a práxis apropriada é simplesmente ponderar a classe minoritária proporcionalmente à sua sub-representação?

130 classification keras weighted-data

5

Qual é o problema do "ReLU moribundo" nas redes neurais?

Referindo-se às notas do curso de Stanford sobre Redes neurais convolucionais para reconhecimento visual , um parágrafo diz: "Infelizmente, as unidades ReLU podem ser frágeis durante o treinamento e podem" morrer ". Por exemplo, um grande gradiente que flui através de um neurônio ReLU pode fazer com que os pesos …

119 machine-learning neural-network deep-learning

5

A função de erro de entropia cruzada em redes neurais

No MNIST para iniciantes em ML, eles definem entropia cruzada como Hy′(y):=−∑iy′ilog(yi)Hy′(y): =-∑EuyEu′registro⁡(yEu)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyEuy_i é o valor de probabilidade previsto para a classeiEui ey′iyEu′y_i' é a verdadeira probabilidade para essa classe. Questão 1 Não é um problema que yiyiy_i (no log(yi)log⁡(yi)\log(y_i) ) possa …

115 machine-learning tensorflow

8

Diferença entre fit e fit_transform nos modelos scikit_learn?

Sou iniciante em ciência de dados e não entendo a diferença entre fite fit_transformmétodos no scikit-learn. Alguém pode simplesmente explicar por que precisamos transformar dados? O que significa ajustar modelo em dados de treinamento e transformar em dados de teste? Significa, por exemplo, converter variáveis categóricas em números no trem …

110 python scikit-learn

6

Média micro versus média macro Desempenho em uma configuração de classificação Multiclass

Estou tentando uma configuração de classificação multiclass com 3 classes. A distribuição de classes é distorcida, com a maioria dos dados caindo em uma das três classes. (os rótulos das classes são 1,2,3, com 67,28% dos dados que caem no rótulo da classe 1, 11,99% dos dados na classe 2 …

102 multiclass-classification evaluation

15

Python vs R para aprendizado de máquina

Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a recomendação?

101 machine-learning r python

3

Quando usar o One Hot Encoding vs LabelEncoder vs DictVectorizor?

Estou construindo modelos com dados categóricos já há algum tempo e, nessa situação, basicamente uso como padrão a função LabelEncoder do scikit-learn para transformar esses dados antes de criar um modelo. Eu entendo a diferença entre OHE, LabelEncodere DictVectorizorem termos do que eles estão fazendo para os dados, mas o …

97 scikit-learn categorical-data feature-engineering

6

Quando usar GRU sobre LSTM?

A principal diferença entre uma GRU e um LSTM é que uma GRU possui duas portas ( redefinir e atualizar portas), enquanto uma LSTM possui três portas (portas de entrada , saída e esquecimento ). Por que usamos GRU quando claramente temos mais controle sobre a rede através do modelo …

95 neural-network deep-learning

12

Qual é o tamanho do big data?

Muitas pessoas usam o termo big data de maneira bastante comercial , como um meio de indicar que grandes conjuntos de dados estão envolvidos na computação e, portanto, as soluções em potencial devem ter um bom desempenho. Obviamente, o big data sempre carrega termos associados, como escalabilidade e eficiência, mas …

86 bigdata scalability efficiency performance

8

Escolhendo uma taxa de aprendizado

Atualmente, estou trabalhando na implementação da descida estocástica de gradiente SGD, para redes neurais usando propagação traseira, e enquanto eu entendo seu objetivo, tenho algumas perguntas sobre como escolher valores para a taxa de aprendizado. A taxa de aprendizado está relacionada à forma do gradiente de erro, conforme determina a …

85 machine-learning neural-network deep-learning optimization hyperparameter

15

Como você visualiza arquiteturas de redes neurais?

Ao escrever um artigo / fazer uma apresentação sobre um tópico sobre redes neurais, geralmente se visualiza a arquitetura das redes. Quais são as maneiras boas / simples de visualizar arquiteturas comuns automaticamente?

80 machine-learning neural-network deep-learning visualization