Por que a medida F geralmente é usada para tarefas de classificação (supervisionadas), enquanto a medida G (ou índice de Fowlkes – Mallows) é geralmente usada para tarefas de agrupamento (não supervisionadas)?
A medida F é a média harmônica da precisão e recuperação .
A medida G (ou índice de Fowlkes – Mallows) é a média geométrica da precisão e recuperação .
Abaixo está um gráfico dos diferentes meios.
F1 (harmônica)
Geométrica
Aritmética
O motivo pelo qual pergunto é que preciso decidir qual média usar em uma tarefa de NLG, onde medi BLEU e ROUGE (onde BLEU é equivalente à precisão e ROUGE para recuperar). Como devo calcular a média dessas pontuações?