Eu implementei o sistema NER com o uso do algoritmo CRF com meus recursos artesanais que deram bons resultados. O fato é que eu usei muitos recursos diferentes, incluindo tags POS e lemas.
Agora eu quero fazer o mesmo NER para um idioma diferente. O problema aqui é que não posso usar tags e lemas de PDV. Comecei a ler artigos sobre aprendizado profundo e aprendizado não supervisionado de recursos.
Minha pergunta é:
É possível usar métodos para o aprendizado não supervisionado de recursos com o algoritmo CRF? Alguém tentou isso e obteve algum bom resultado? Existe algum artigo ou tutorial sobre esse assunto?
Ainda não entendo completamente esse modo de criação de recursos, por isso não quero gastar muito tempo com algo que não funcionará. Portanto, qualquer informação seria realmente útil. Criar um sistema NER completo com base em aprendizado profundo é um pouco demais por enquanto.