Não são a mesma coisa e são frequentemente usados em contextos diferentes. A pontuação de dados é frequentemente usada para quantificar o desempenho dos métodos de segmentação de imagens . Lá, você anota alguma região de base da verdade na sua imagem e cria um algoritmo automatizado para fazer isso. Você valida o algoritmo calculando a pontuação de dados, que é uma medida de quão semelhantes são os objetos. Portanto, é o tamanho da sobreposição das duas segmentações dividido pelo tamanho total dos dois objetos. Usando os mesmos termos da descrição da precisão, a pontuação dos dados é:
Dice score=2⋅number of true positives2⋅number of true positives + number of false positives + number of false negatives
Portanto, o número de verdadeiros positivos é o número encontrado pelo seu método, o número de positivos é o número total de positivos que podem ser encontrados e o número de falsos positivos é o número de pontos negativos que o seu método classifica como positivo.
A pontuação dos dados não é apenas uma medida de quantos positivos você encontra, mas também penaliza os falsos positivos que o método encontra, semelhante à precisão. portanto, é mais parecido com precisão do que com precisão. A única diferença é o denominador, onde você tem o número total de positivos, em vez de apenas os positivos encontrados pelo método. Portanto, a pontuação dos dados também penaliza os aspectos positivos que seu algoritmo / método não conseguiu encontrar.
Edit: No caso de segmentação de imagem, digamos que você tenha uma máscara com verdade absoluta, vamos chamar a máscara como você sugere. Portanto, a máscara tem valores 1 nos pixels, onde há algo que você está tentando encontrar e mais zero. Agora você tem um algoritmo para gerar imagem / máscara , que também deve ser uma imagem binária, ou seja, você cria uma máscara para sua segmentação. Então temos o seguinte:AB
- Número de positivos é o número total de pixels que têm intensidade 1 na imagemA
- Número de verdadeiros positivos é o número total de pixels, que têm o valor 1 em ambos e . Por isso, a interseção das regiões queridos em e . É o mesmo que usar o operador AND em e .ABABAB
- Número de falsos positivos é o número de pixels que aparecem como 1 em , mas zero .BA
Se você estiver fazendo isso para uma publicação, escreva Dice com D maiúsculo, porque é nomeado após um cara chamado Dice.
EDIT: Sobre o comentário sobre uma correção: Eu não uso a fórmula tradicional para calcular o coeficiente de dados, mas se eu o traduzir para a notação da outra resposta, ele se tornará:
Dice score=2⋅|A∩B|2⋅|A∩B|+|B∖A|+|A∖B|
O que é equivalente à definição tradicional. É mais conveniente escrevê-lo da maneira que escrevi originalmente para indicar a fórmula em termos de falsos positivos. A barra invertida é o conjunto de menos.