Vi recentemente um recurso interessante que já estava disponível no Planilhas Google: você começa escrevendo algumas palavras-chave relacionadas em células consecutivas, diga: "azul", "verde", "amarelo" e gera automaticamente palavras-chave semelhantes (neste caso , outras cores). Veja mais exemplos neste vídeo do YouTube .
Eu gostaria de reproduzir isso no meu próprio programa. Estou pensando em usar o Freebase, e funcionaria assim intuitivamente:
- Recupere a lista de palavras fornecidas no Freebase;
- Encontre seus "denominadores comuns" e construa uma métrica de distância com base nisso;
- Classifique outros conceitos com base na "distância" das palavras-chave originais;
- Exiba os próximos conceitos mais próximos.
Como não estou familiarizado com esta área, minhas perguntas são:
- Existe uma maneira melhor de fazer isso?
- Quais ferramentas estão disponíveis para cada etapa?