Dadas taxas de verdadeiro positivo, falso negativo, você pode calcular o falso positivo, o negativo verdadeiro?


Respostas:


53

Há um pouco de confusão terminológica nessa área. Pessoalmente, sempre acho útil voltar a uma matriz de confusão para pensar sobre isso. Em um teste de classificação / triagem, você pode ter quatro situações diferentes:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

Nesta tabela, "verdadeiro positivo", "falso negativo", "falso positivo" e "verdadeiro negativo" são eventos (ou sua probabilidade). O que você tem é, portanto, provavelmente uma taxa positiva verdadeira e uma taxa negativa falsa . A distinção é importante porque enfatiza que ambos os números têm um numerador e um denominador.

Onde as coisas ficam um pouco confusas é que você pode encontrar várias definições de "taxa de falsos positivos" e "taxa de falsos negativos", com diferentes denominadores.

Por exemplo, a Wikipedia fornece as seguintes definições (elas parecem bastante padrão):

  • TPR=TP/(TP+FN)
  • FPR=FP/(FP+TN)
  • TNR=TN/(FP+TN)

Em todos os casos, o denominador é o total da coluna . Isso também dá uma pista para a interpretação deles: a verdadeira taxa positiva é a probabilidade de o teste dizer "A" quando o valor real é de fato A (ou seja, é uma probabilidade condicional, condicionada a A ser verdadeira). Isso não indica a probabilidade de você estar correto ao chamar "A" (ou seja, a probabilidade de um verdadeiro positivo, condicionada ao resultado do teste ser "A").

FNR=1 1-TPR

No entanto, existem outras definições na literatura. Por exemplo, Fleiss ( métodos estatísticos para taxas e proporções ) oferece o seguinte:

  • "[...] a taxa de falsos positivos [...] é a proporção de pessoas, entre as que respondem positivamente e que estão realmente livres da doença".
  • "A taxa de falsos negativos [...] é a proporção de pessoas, entre as que responderam negativamente no teste, que ainda têm a doença."

(Ele também reconhece as definições anteriores, mas as considera "desperdiçadoras de terminologia preciosa", precisamente porque elas têm uma relação direta com sensibilidade e especificidade.)

FPR=FP/(TP+FP)FNR=FN/(TN+FN)

Fleiss não usa ou define as frases "taxa negativa verdadeira" ou "taxa positiva verdadeira", mas se assumirmos que essas também são probabilidades condicionais, dadas um determinado resultado / classificação de teste, a resposta @ guill11aume é a correta.

De qualquer forma, você precisa ter cuidado com as definições, porque não há resposta indiscutível para sua pergunta.


4
Muito bom (+1). Eu pulei imediatamente em uma interpretação, mas você está absolutamente certo de que a definição alternativa é padrão.
gui11aume

11
@ gui11aume. Obrigado! Era o meu sentimento, mas, pensando nisso, não tenho mais tanta certeza. Observando as referências, pode depender do campo (aprendizado de máquina vs. testes médicos).
Gala #

Minha experiência é que a última definição, TPR = TP / (TP + FP), FPR = FP / (TP + FP) é mais padrão.
travelingbones

11
Aqui está uma publicação sobre as diferenças: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Observe a nova terminologia "Test FPR" vs. "Predictive FPR"
travelingbones

8

EDIT: veja a resposta de Gaël Laurans, que é mais precisa.

Se a sua verdadeira taxa positiva é de 0,25, significa que toda vez que você chama um positivo, você tem uma probabilidade de 0,75 de estar errado. Esta é a sua taxa de falsos positivos. Da mesma forma, toda vez que você chama de negativo, você tem uma probabilidade de 0,25 de estar certo, que é sua verdadeira taxa negativa.


Depende do que se está tentando caracterizar: o teste, no cenário, de conhecer a verdade de antemão, ou tentar decidir a probabilidade do pós-teste, apenas com os resultados em mãos.
kd4ttc

3

Nenhuma se isso fizer algum sentido se "positivo" e "negativo" não fizerem sentido para o problema em questão. Vejo muitos problemas em que "positivo" e "negativo" são escolhas forçadas arbitrárias em uma variável ordinal ou contínua. FP, TP, sens, spec são úteis apenas para fenômenos de tudo ou nada.


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.