Considere o problema de filtragem colaborativa. Temos matriz de tamanho #users * #items. se o usuário gostar do item j, se o usuário não item j ese não houver dados sobre o par (i, j). Queremos prever para futuros pares de itens e usuários.
A abordagem de filtragem colaborativa padrão é representar M como produto de 2 matrizes modo que é mínimo (por exemplo, minimizando o erro quadrático médio para elementos conhecidos de M ).
Para mim, a função de perda logística parece mais adequada, por que todos os algoritmos estão usando o MSE?