Recomendação de filmes com recursos adicionais usando filtragem colaborativa


16

Estou tentando criar um sistema de recomendação usando filtragem colaborativa. Eu tenho as [user, movie, rating]informações usuais . Gostaria de incorporar um recurso adicional, como 'idioma' ou 'duração do filme'. Não tenho certeza de quais técnicas eu poderia usar para esse problema.

Por favor, sugira referências ou pacotes em python / R.

Respostas:


17

Aqui estão alguns recursos que podem ser úteis:


4

Em vez da filtragem colaborativa, eu usaria a abordagem de fatoração matricial, na qual usuários e filmes são representados por vetores de recursos latentes cujos produtos pontuais produzem as classificações. Normalmente, apenas se seleciona a classificação (número de características) sem levar em consideração o que as características representam, e o algoritmo faz o resto. Como o PCA, o resultado não é imediatamente interpretável, mas produz bons resultados. O que você deseja fazer é estender a matriz do filme para incluir os recursos adicionais mencionados e garantir que eles permaneçam fixos, pois o algoritmo estima as duas matrizes usando a regularização. As entradas correspondentes na matriz do usuário serão inicializadas aleatoriamente, depois estimadas pelo algoritmo de fatoração da matriz. É uma abordagem versátil e de alto desempenho, mas é preciso entender o aprendizado de máquina,

Vi um bom notebook ipython há um tempo, mas não o encontro no momento. Por isso, vou encaminhá-lo para outro que, embora não seja tão bom, ainda esclarece algumas das matemáticas.


Obrigado, eu estava procurando algo nessas linhas. Seria extremamente útil se você pudesse dar referência a um tutorial ou notebook ipython discutindo isso.
Sidhha
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.