Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo

2
Ganho de informações em R
Encontrei pacotes sendo usados ​​para calcular o "Ganho de Informações" para selecionar os principais atributos na Árvore de Decisão C4.5 e tentei usá-los para calcular o "Ganho de Informações". Mas os resultados do cálculo de cada pacote são diferentes, como no código abaixo. > IG.CORElearn <- attrEval(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi, dataUSE1, …

1
Machine Learning: escrevendo poemas
Sou estudante de aprendizado de máquina e hoje em dia estava tentando aprender como usar a biblioteca TensorFlow. Passei por vários tutoriais e tentativas e erros com o tensorflow, e pensei que a melhor maneira de aprendê-lo de verdade seria usá-lo em um pequeno projeto meu. Decidi que deveria tentar …

4
Classe desequilibrada: class_weight para algoritmos ML no Spark MLLib
No python sklearn, existem vários algoritmos (por exemplo, regressão, floresta aleatória ... etc.) que possuem o parâmetro class_weight para manipular dados desequilibrados. No entanto, não encontro esse parâmetro para os algoritmos MLLib. Existe um plano de implementar class_weight para algum algoritmo MLLib? Ou existe alguma abordagem no MLLib para dados …






3
Como avaliar o agrupamento de texto?
Quais métricas podem ser usadas para avaliar modelos de cluster de texto? Eu usei tf-idf+ k-means, tf-idf+ hierarchical clustering, doc2vec+ k-means (metric is cosine similarity), doc2vec+ hierarchical clustering (metric is cosine similarity). Como decidir qual modelo é o melhor?


2
Contando índices em pandas
Sinto que essa é uma pergunta rudimentar, mas sou muito nova nisso e simplesmente não consegui decifrá-la / encontrar a resposta. Em última análise, o que estou tentando fazer aqui é contar valores exclusivos em uma determinada coluna e determinar quais desses valores únicos têm mais de um valor exclusivo …



2
O que é uma formulação LSTM-LM?
Estou lendo este artigo "Sequência para aprendizado de sequência com redes neurais" http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf Em "2. O Modelo", diz: O LSTM calcula essa probabilidade condicional obtendo primeiro a representação dimensional fixa v da sequência de entrada (x1,..., XT) dada pelo último estado oculto do LSTM e depois calculando a probabilidade de …

1
Número mínimo de árvores para o classificador Random Forest
Estou procurando uma estimativa teórica ou experimental do limite inferior para o número de árvores em um classificador Random Forest. Normalmente testo combinações diferentes e seleciono aquela que (usando a validação cruzada) fornece o melhor resultado mediano. No entanto, penso que pode haver um limite no número de árvores para …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.