Estou tentando combinar itens. Dado um conjunto de itens, posso classificar em uma escala de 0 a 100 de quão semelhantes eles são entre si. Por exemplo, se o item é leite e o item também é leite, a semelhança entre e seria 100%. Se for refrigerante, a similaridade entre e seria, talvez, 80% e assim por diante.
Estou tentando descobrir como agrupar os itens em grupos de itens semelhantes, mas é um problema desafiador. Eu me deparo com o seguinte problema: Um cavalo é semelhante a uma vaca, que é semelhante a uma cabra, que é em parte semelhante ao queijo de cabra, que é semelhante ao queijo, que está correlacionado com biscoitos. No entanto, eu não esperaria que um cavalo estivesse no mesmo grupo que biscoitos. Cada item pode estar correlacionado em pares, mas o começo e o fim podem não estar.
Alguma ideia?