Eu construí algumas redes neurais (MLP (totalmente conectadas), Elman (recorrente)) para tarefas diferentes, como jogar Pong, classificar dígitos manuscritos e outras coisas ...
Além disso, tentei criar algumas primeiras redes neurais convolucionais, por exemplo, para classificar notas manuscritas de vários dígitos, mas sou completamente novo para analisar e agrupar textos, por exemplo, nas tarefas de reconhecimento / agrupamento de imagens, podemos confiar em entradas padronizadas, como imagens de tamanho 25x25, RGB ou escala de cinza e assim por diante ... há muitos recursos de pré-suposição.
Para mineração de texto, por exemplo, artigos de notícias, você tem um tamanho de entrada em constante mudança (palavras diferentes, frases diferentes, tamanho de texto diferente, ...).
Como implementar uma ferramenta moderna de mineração de texto utilizando inteligência artificial, de preferência redes neurais / SOMs?
Infelizmente, não consegui encontrar tutoriais simples para começar. Trabalhos científicos complexos são difíceis de ler e não são a melhor opção para aprender um tópico (como na minha opinião). Eu já li alguns artigos sobre MLPs, técnicas de abandono, redes neurais convolucionais e assim por diante, mas não consegui encontrar um básico sobre mineração de texto - tudo o que encontrei foi um nível alto demais para minhas habilidades muito limitadas de mineração de texto.