Supondo uma classificação cruzada como a mostrada abaixo (aqui, para um instrumento de triagem)
podemos definir quatro medidas de precisão da triagem e poder preditivo:
- Sensibilidade (se), a / (a + c), ou seja, a probabilidade da tela fornecer um resultado positivo, considerando que a doença está presente;
- Especificidade (sp), d / (b + d), ou seja, a probabilidade de a tela fornecer um resultado negativo, dado que a doença está ausente;
- Valor preditivo positivo (VPP), a / (a + b), ou seja, a probabilidade de pacientes com resultados positivos nos testes serem diagnosticados corretamente (como positivos);
- Valor preditivo negativo (VPN), d / (c + d), ou seja, a probabilidade de pacientes com resultados de testes negativos que são diagnosticados corretamente (como negativos).
Cada quatro medidas são proporções simples calculadas a partir dos dados observados. Um teste estatístico adequado seria, portanto, um teste binomial (exato) , que deve estar disponível na maioria dos pacotes estatísticos ou em muitas calculadoras on-line. A hipótese testada é se as proporções observadas diferem significativamente de 0,5 ou não. Achei, no entanto, mais interessante fornecer intervalos de confiança do que um único teste de significância, pois fornece informações sobre a precisão da medição. De qualquer forma, para reproduzir os resultados mostrados, você precisa conhecer as margens totais da sua mesa de mão dupla (você forneceu apenas o PPV e o NPV como%).
Como exemplo, suponha que observemos os seguintes dados (o questionário CAGE é um questionário de triagem para álcool):
então em R o PPV seria calculado da seguinte forma:
> binom.test(99, 142)
Exact binomial test
data: 99 and 142
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.6145213 0.7714116
sample estimates:
probability of success
0.6971831
Se você estiver usando SAS, poderá observar a Nota de uso 24170: Como posso estimar sensibilidade, especificidade, valores preditivos positivos e negativos, probabilidades de falso positivo e negativo e proporções de probabilidade?.
Para calcular intervalos de confiança, a aproximação gaussiana, p ± 1,96 × p ( 1 - p ) / n---------√ (1,96 sendo o quantil da distribuição normal padrão em p = 0,975 ou 1 - α / 2 com α = 5%), é usado na prática, especialmente quando as proporções são muito pequenas ou grandes (o que geralmente acontece aqui).
Para referência adicional, você pode ver
Newcombe, RG. Intervalos de confiança frente e verso para uma única proporção: comparação de sete métodos .
Statistics in Medicine , 17, 857-872 (1998).