Então, estou começando a aprender como uma rede neural pode operar para reconhecer padrões e categorizar entradas, e vi como uma rede neural artificial pode analisar dados de imagem e categorizar as imagens ( demo com convnetjs ), e a chave é reduzir a amostra da imagem e cada pixel estimula um neurônio de entrada na rede.
No entanto, estou tentando entender se isso é possível com entradas de string? O caso de uso que eu tenho é um "mecanismo de recomendação" para filmes que um usuário assistiu. Os filmes têm muitos dados de sequência (título, enredo, tags), e eu poderia imaginar "reduzir a amostragem" do texto para algumas palavras-chave que descrevem esse filme, mas mesmo se eu analisar as cinco principais palavras que descrevem esse filme, eu acha que precisaria de neurônios de entrada para cada palavra em inglês para comparar um conjunto de filmes? Eu poderia limitar os neurônios de entrada apenas às palavras usadas no conjunto, mas poderia crescer / aprender adicionando novos filmes (o usuário assiste a um novo filme, com novas palavras)? A maioria das bibliotecas que eu vi não permite adicionar novos neurônios após o treinamento do sistema?
Existe uma maneira padrão de mapear dados de cadeia / palavra / caractere para entradas em uma rede neural? Ou uma rede neural realmente não é a ferramenta certa para o trabalho de analisar dados de string como este (qual é a melhor ferramenta para correspondência de padrões em dados de string)?