Recentemente, entrei no mundo do aprendizado de máquina e um projeto no qual estou trabalhando exige que eu agrupe os usuários com base na ordem em que eles visitaram as páginas da Web em um site. Eu tenho dados na forma de:
['user_id', 1, 2, 4, 6, 3, 7, 3, 2, 4...]
Onde cada número é uma categoria / página que o usuário visitou. Além disso, o comprimento dos dados para cada usuário não é o mesmo, ou seja, alguns usuários visitam mais páginas do que outros.
Sei que isso é realmente vago e que define semelhança difícil. Tentei seguir o exemplo deste trabalho de pesquisa e, para ser sincero, muito disso passou pela minha cabeça.
Preciso de ajuda para lidar com esse problema e estou aberto a novas idéias e sugestões.