Tenho uma atribuição de mineração de dados em que faço um sistema de recuperação de imagens com base em conteúdo. Eu tenho 20 imagens de 5 animais. Assim, no total, 100 imagens.
Meu sistema retorna as 10 imagens mais relevantes para uma imagem de entrada. Agora, preciso avaliar o desempenho do meu sistema com uma curva Precision-Recall. No entanto, não entendo o conceito de uma curva Precision-Recall. Digamos que meu sistema retorne 10 imagens para uma imagem de gorila, mas apenas 4 delas são gorilas. As outras 6 imagens retornadas são de outros animais. Portanto,
- precisão é
4/10 = 0.4
(relevantes retornados) / (todos retornados) - recall é
4/20 = 0.2
(relevantes retornados) / (todos os relevantes)
Então, eu só tenho um ponto <0.2,0.4>
, não uma curva. Como tenho uma curva (ou seja, um conjunto de pontos)? Devo alterar o número de imagens retornadas (isso é fixado em 10 no meu caso)?