O motivo para definir a pontuação F-beta com β2 é exatamente a citação que você fornece (ou seja, querer atribuir β vezes mais importância à recordação do que precisão), dada uma definição específica para o que significa atribuir β vezes a importância da recordação que precisão.
A maneira particular de definir a importância relativa das duas métricas que leva à formulação de β2 pode ser encontrada em Information Retrieval (Van Rijsbergen, 1979):
Definição: A importância relativa que um usuário atribui à precisão e ao recall é a razão P/ R na qual ∂E/ ∂R =∂E/ ∂P , onde E= E( P, R ) é a medida de eficácia baseada na precisão e recordar.
A motivação para este ser:
A maneira mais simples que conheço de quantificar isso é especificar a razão P/ R na qual o usuário está disposto a trocar um incremento de precisão por uma perda igual de recall.
Para ver que isto conduz à β2 formulação que pode começar com a fórmula geral para a média harmónica ponderada de P e R e calcular as suas derivadas parciais em relação a P e R . A fonte citada usos E (para "medir a eficácia"), que é apenas 1 - F ea explicação é equivalente se considerarmos E ou F .
F= 1( αP+ 1 - αR)
∂F/ ∂P= α( αP+ 1 - αR)2P2
∂F/ ∂R = 1 - α( αP+ 1 - αR)2R2
Agora, definindo os derivados iguais uns aos outros locais de restrição de uma sobre a relação entre α e a relação P/ R . Dado que desejamos atribuir β vezes mais importância à recordação do que precisão, consideraremos a razão R / P 1 :
∂F/ ∂P= ∂F/ ∂R → αP2= 1 - αR2→ RP= 1 - αα-----√
Definir β como essa razão e reorganizar para α fornece as ponderações em termos de β2 :
β= 1 - αα-----√→ β2= 1 - αα→ β2+ 1 = 1α→ α = 1β2+ 1
1 - α = 1 - 1β2+ 1→ β2β2+ 1
Nós obtemos:
F= 1( 1β2+ 11 1P+ β2β2+ 11 1R)
Que pode ser reorganizado para fornecer o formulário em sua pergunta.
ββ2βββ--√
Você pode definir uma pontuação como sugere, no entanto, esteja ciente de que, neste caso, a interpretação discutida não é mais válida ou está implicando alguma outra definição para quantificar a troca entre precisão e recall.
Notas de rodapé:
- P/ R
Referências:
- CJ Van Rijsbergen. 1979. Information Retrieval (2ª ed.), Pp.133-134
- Y. Sasaki. 2007. “A Verdade da F-medida”, Ensino, Materiais tutoriais