Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo




4
Alguma “regra de ouro” no número de recursos versus número de instâncias? (pequenos conjuntos de dados)
Pergunto-me, se há alguma heurística no número de características versus número de observações. Obviamente, se um número de recursos for igual ao número de observações, o modelo será super ajustado. Usando métodos esparsos (LASSO, rede elástica), podemos remover vários recursos para reduzir o modelo. Minha pergunta é (teoricamente): antes de …

3
Como calcular o impacto da memória do minilote ao treinar modelos de aprendizado profundo?
Estou tentando calcular a quantidade de memória necessária para uma GPU treinar meu modelo com base nas notas de Andrej Karphaty: http://cs231n.github.io/convolutional-networks/#computational-considerations Minha rede possui 532.752 ativações e 19.072.984 parâmetros (pesos e vieses). Esses são todos os valores flutuantes de 32 bits; portanto, cada um deles ocupa 4 bytes de …

1
Rede neural profunda - retropropagação com ReLU
Estou tendo alguma dificuldade em derivar a propagação com a ReLU e fiz algum trabalho, mas não tenho certeza se estou no caminho certo. Função de custo: 12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2em queyyyé o valor real, e y é um valor previsto. Suponha também quex> 0 sempre.y^y^\hat yxxx ReLU de 1 camada, em …

4
Qual é o benefício de dividir o arquivo tfrecord em shards?
Estou trabalhando no reconhecimento de fala com o Tensorflow e planejo treinar o LSTM NN com um conjunto de dados massivo de ondas. Devido aos ganhos de desempenho, pretendo usar os tfrecords. Existem vários exemplos na internet (Inception for ex.) Em que os arquivos tfrecords são divididos em shards. Minha …

5
Mesclando dados esparsos e densos no aprendizado de máquina para melhorar o desempenho
Eu tenho características esparsas que são preditivas, também tenho algumas características densas que também são preditivas. Preciso combinar esses recursos para melhorar o desempenho geral do classificador. Agora, quando tento combiná-los, os recursos densos tendem a dominar mais sobre os recursos esparsos, oferecendo, portanto, apenas 1% de melhoria na AUC …








Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.