Medida de desempenho: por que é chamado de recall?


11

precisão é a fração de instâncias recuperadas relevantes, enquanto recall (também conhecido como sensibilidade) é a fração de instâncias relevantes recuperadas.

Eu sei o significado delas, mas não sei por que isso se chama recall ? Eu não sou falante nativo de inglês. Eu sei que recordar significa recordar, então não sei a relevância desse significado para esse conceito! talvez a cobertura tenha sido melhor porque mostra quantas instâncias foram cobertas ... ou qualquer outro termo.

Além disso, a sensibilidade também é insensível para mim!

Você poderia me ajudar a associar essas palavras ao conceito e ter uma noção delas?


"precisão é a fração de instâncias recuperadas que são relevantes, enquanto recall (também conhecido como sensibilidade) é a fração de instâncias relevantes que são recuperadas." essa definição parece bastante concisa. De onde você pegou isso?
Sanghyun Lee 12/12/19

Respostas:


5

Eu acho que o termo "sensibilidade" vem do mundo dos exames médicos. Um teste muito sensível será positivo para a maioria ou todas as pessoas que fazem o teste e realmente têm uma doença, assim como para muitas pessoas que não o fazem. Isso corresponde a um recall alto, o que significa que a consulta recupera a maioria ou todos os documentos relevantes, bem como muitos que podem não ser relevantes.


3

Recordar significa trazer de volta ou lembrar. A terminologia vem da recuperação de informações, onde geralmente está sendo aplicada a um conjunto de resultados de uma consulta. Suponho que o sentido seja: quanto do conjunto de respostas corretas foi recuperado pela consulta? quanto disso foi lembrado?

Não sei se a "cobertura" é melhor ou não. A palavra "sensibilidade" também é usada para significar a mesma coisa que "recordar". De qualquer forma, essas são apenas as palavras padrão para essas idéias.


11
E outro - verdadeira taxa positiva.
stmax

11
Obrigado, então seu sentido está perto de "recuperar", "recuperar" em si era melhor!
Ahmad

Eu modifiquei um pouco minha pergunta.
Ahmad

2

recall é chamado de 'recall' porque é a fração de instâncias relevantes (conjunto de treinamento) que foram 'recuperadas' (sim ou 'recuperadas' como você sugere. 'cobertura' seria mais ambígua, poderia ser mal interpretada como outras coisas, por exemplo, a porcentagem do conjunto de treinamento em que você treinou (por exemplo, uma partição. Sua 'cobertura' sugerida faria sentido no conjunto de treinamento, mas não no conjunto de testes, portanto é muito ambíguo).

Eu sempre assumi que o motivo pelo qual 'recall' também era conhecido como 'sensibilidade' devido ao processamento de sinais ou influências médicas: pense em um detector de minas, radar ou teste de uma doença: 'sensível' significaria que ele capta a maioria / todos os exemplos relevantes conhecidos (do conjunto de treinamento).

Sim, os nomes arcanos da maioria desses termos são seriamente pouco intuitivos e são uma colcha de retalhos desenhada a partir de um vocabulário de campos díspares ao longo de muitas décadas, mas eles estão gravados em pedra agora, então você só precisa encontrar um mnemônico para aprendê-los e não conseguir também desliguei e continuei com as coisas ...


0

Disclaimer: Eu também não sou um falante nativo.

A primeira coisa que me veio à mente é que você ouve algumas vezes nas notícias que alguma montadora precisa recuperar alguns veículos por causa de alguns problemas. Mas, geralmente, eles só lembram carros com base em alguns critérios. Portanto, nem todos os carros com o problema são "recuperados". Para reformular, enquanto alguns daqueles com problemas (verdadeiro positivo) são lembrados, outros com os problemas podem não se qualificar para os critérios do recall (falso negativo).

Eu acho que a sensibilidade pode ser interpretada do ângulo da "regra / critério do recall" . Uma sensibilidade mais alta significa que a regra é mais sensível ao problema (por exemplo, problemas de um carro), mas isso provavelmente resultará em um falso positivo mais alto.

Portanto, no geral, a recordação está entre os verdadeiros positivos, a porcentagem identificada com sucesso (recordada). Sensibilidade é a sensibilidade da regra / algoritmo de classificação ao problema (atributos do verdadeiro positivo).

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.