Estou trabalhando em um sistema de recomendação de livros muito básico. Quero saber o que fazer com os campos que não são classificados pelo usuário ao encontrar similaridade de cosseno, devemos ignorá-los e calcular apenas com os campos classificados ou marcá-los 0.
O livro que estou seguindo diz para excluir os campos, pois dará uma interpretação incorreta no caso da Correlação Euclidiana e Pearson, mas no caso da Semelhança Cosina, ele faz com que todos os campos não classificados sejam 0.
Alguém pode explicar por que é necessário fazer com que os campos não classificados sejam 0 apenas para Cosine e não outros, ou existe uma maneira diferente de fazê-lo. (Eu sei como fazer os campos 0 em Euclidiano e Pearson afeta a saída, mas não tenho certeza do cosseno)