Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

10
O que são camadas deconvolucionais?
Li recentemente Redes totalmente convolucionais para segmentação semântica de Jonathan Long, Evan Shelhamer, Trevor Darrell. Não entendo o que as "camadas desconvolucionais" fazem / como elas funcionam. A parte relevante é 3.3 Upsampling é convolução para trás Outra maneira de conectar saídas grosseiras a pixels densos é a interpolação. Por …

30
Conjuntos de dados publicamente disponíveis
Um dos problemas comuns na ciência de dados é coletar dados de várias fontes em um formato de alguma forma limpo (semiestruturado) e combinar métricas de várias fontes para fazer uma análise de nível superior. Observando o esforço de outras pessoas, especialmente outras perguntas neste site, parece que muitas pessoas …

13
K-Means clustering para dados numéricos e categóricos mistos
Meu conjunto de dados contém vários atributos numéricos e um categórico. Dizer, NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, onde CategoricalAttrleva um dos três valores possíveis: CategoricalAttrValue1, CategoricalAttrValue2ou CategoricalAttrValue3. Estou usando a implementação padrão do algoritmo de agrupamento k-means para o Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funciona apenas com dados numéricos. Então, minha pergunta: …




5
A função de erro de entropia cruzada em redes neurais
No MNIST para iniciantes em ML, eles definem entropia cruzada como Hy′(y):=−∑iy′ilog(yi)Hy′(y): =-∑EuyEu′registro⁡(yEu)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyEuy_i é o valor de probabilidade previsto para a classeiEui ey′iyEu′y_i' é a verdadeira probabilidade para essa classe. Questão 1 Não é um problema que yiyiy_i (no log(yi)log⁡(yi)\log(y_i) ) possa …

8
Diferença entre fit e fit_transform nos modelos scikit_learn?
Sou iniciante em ciência de dados e não entendo a diferença entre fite fit_transformmétodos no scikit-learn. Alguém pode simplesmente explicar por que precisamos transformar dados? O que significa ajustar modelo em dados de treinamento e transformar em dados de teste? Significa, por exemplo, converter variáveis ​​categóricas em números no trem …


15
Python vs R para aprendizado de máquina
Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a recomendação?


6
Quando usar GRU sobre LSTM?
A principal diferença entre uma GRU e um LSTM é que uma GRU possui duas portas ( redefinir e atualizar portas), enquanto uma LSTM possui três portas (portas de entrada , saída e esquecimento ). Por que usamos GRU quando claramente temos mais controle sobre a rede através do modelo …

12
Qual é o tamanho do big data?
Muitas pessoas usam o termo big data de maneira bastante comercial , como um meio de indicar que grandes conjuntos de dados estão envolvidos na computação e, portanto, as soluções em potencial devem ter um bom desempenho. Obviamente, o big data sempre carrega termos associados, como escalabilidade e eficiência, mas …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.