Ciência de dados

Perguntas e respostas para profissionais de ciência de dados, especialistas em aprendizado de máquina e interessados ​​em aprender mais sobre o campo




2
que técnicas de machine / deep learning / nlp são usadas para classificar determinadas palavras como nome, número de celular, endereço, email, estado, município, cidade etc.
Estou tentando gerar um modelo inteligente que pode digitalizar um conjunto de palavras ou seqüências de caracteres e classificá-los como nomes, números de celular, endereços, cidades, estados, países e outras entidades usando aprendizado de máquina ou aprendizado profundo. Eu tinha procurado abordagens, mas infelizmente não encontrei nenhuma abordagem a seguir. …


1
Dados desequilibrados, causando má classificação no conjunto de dados de várias classes
Estou trabalhando na classificação de texto, onde tenho 39 categorias / classes e 8,5 milhões de registros. (No futuro, dados e categorias aumentarão). Estrutura ou formato dos meus dados é o seguinte. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 …

2
Qual algoritmo aplicar para escolher o ponto certo
A figura abaixo mostra 7 pontos em torno da origem. Um deles foi selecionado por um humano com base em regras e experiência e é colorido de vermelho (aquele no quadrante inferior esquerdo). Agora, temos mais de 1000 desses conjuntos de pontos e, para cada conjunto, um humano selecionou um …





3
Por que não treinar o modelo final em todos os dados após executar os dados de teste da base de ajuste do hiperparâmetro e os dados de validação da base de seleção de modelo?
Por dados completos, quero dizer treinar + testar + validação Depois de corrigir meu hiperparâmetro usando os dados de validação e escolher o modelo usando os dados de teste, não será melhor ter um modelo treinado em todos os dados para que os parâmetros sejam melhor treinados do que ter …


4
Classificar séries temporais multivariadas
Eu tenho um conjunto de dados composto por séries temporais (8 pontos) com cerca de 40 dimensões (portanto, cada série temporal é 8 por 40). A saída correspondente (os possíveis resultados para as categorias) é igual a 0 ou 1. Qual seria a melhor abordagem para projetar um classificador para …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.