Estou tentando gerar um modelo inteligente que pode digitalizar um conjunto de palavras ou seqüências de caracteres e classificá-los como nomes, números de celular, endereços, cidades, estados, países e outras entidades usando aprendizado de máquina ou aprendizado profundo.
Eu tinha procurado abordagens, mas infelizmente não encontrei nenhuma abordagem a seguir. Eu tentei com o modelo de saco de palavras e incorporação de palavras de luvas para prever se uma string é nome ou cidade etc.
Mas não obtive sucesso com o modelo de saco de palavras e com o GloVe existem muitos nomes que não são abordados no exemplo de incorporação: - lauren está presente no Glove e laurena não está
Eu encontrei este post aqui , que tinha uma resposta razoável, mas não consegui abordar o problema usado para resolver esse problema além do fato de que a PNL e o SVM foram usados para resolvê-lo.
Todas as sugestões são apreciadas
Obrigado e cumprimentos, Sai Charan Adurthi.