Estou implementando um sistema de classificação para ser usado no meu site e acho que a média bayesiana é a melhor maneira de fazer isso. Cada item será classificado em seis categorias diferentes pelos usuários. Não quero que itens com apenas uma classificação alta atinjam o topo, e é por isso que quero implementar um sistema bayesiano.
Aqui está a fórmula:
Bayesian Rating = ( (avg_num_votes * avg_rating) + (this_num_votes * this_rating) ) / (avg_num_votes + this_num_votes)
Como os itens serão classificados em 6 categorias diferentes, devo usar a média das somas dessas categorias como "this_rating" para o sistema bayesiano? Por exemplo, considere um item com duas classificações (escala de 0 a 5):
Rating 1:
Category A: 3
Category B: 1
Category C: 2
Category D: 4
Category E: 5
Category F: 3
Sum: 18
Rating 2:
Category A: 2
Category B: 3
Category C: 3
Category D: 5
Category E: 0
Category F: 1
Sum: 14
"This_rating" deve ser simplesmente a média das somas listadas acima? Meu pensamento está correto, ou um sistema bayesiano também deve ser implementado para cada categoria (ou isso é exagero)?