Teste estatístico para valor preditivo positivo e negativo

Eu estava lendo um artigo e vi uma tabela com uma comparação entre PPV (Valor Preditivo Positivo) e NPV (Valor Preditivo Negativo). Eles fizeram algum tipo de teste estatístico para eles, este é um esboço da tabela:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Todas as linhas se referem a uma tabela de contingência específica.

Que tipo de teste de hipótese eles fizeram? Obrigado!

epidemiology contingency-tables p-value

— Simone
fonte

Supondo uma classificação cruzada como a mostrada abaixo (aqui, para um instrumento de triagem)

texto alternativo

podemos definir quatro medidas de precisão da triagem e poder preditivo:

Sensibilidade (se), a / (a + c), ou seja, a probabilidade da tela fornecer um resultado positivo, considerando que a doença está presente;
Especificidade (sp), d / (b + d), ou seja, a probabilidade de a tela fornecer um resultado negativo, dado que a doença está ausente;
Valor preditivo positivo (VPP), a / (a + b), ou seja, a probabilidade de pacientes com resultados positivos nos testes serem diagnosticados corretamente (como positivos);
Valor preditivo negativo (VPN), d / (c + d), ou seja, a probabilidade de pacientes com resultados de testes negativos que são diagnosticados corretamente (como negativos).

Cada quatro medidas são proporções simples calculadas a partir dos dados observados. Um teste estatístico adequado seria, portanto, um teste binomial (exato) , que deve estar disponível na maioria dos pacotes estatísticos ou em muitas calculadoras on-line. A hipótese testada é se as proporções observadas diferem significativamente de 0,5 ou não. Achei, no entanto, mais interessante fornecer intervalos de confiança do que um único teste de significância, pois fornece informações sobre a precisão da medição. De qualquer forma, para reproduzir os resultados mostrados, você precisa conhecer as margens totais da sua mesa de mão dupla (você forneceu apenas o PPV e o NPV como%).

Como exemplo, suponha que observemos os seguintes dados (o questionário CAGE é um questionário de triagem para álcool):

texto alternativo

então em R o PPV seria calculado da seguinte forma:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831

Se você estiver usando SAS, poderá observar a Nota de uso 24170: Como posso estimar sensibilidade, especificidade, valores preditivos positivos e negativos, probabilidades de falso positivo e negativo e proporções de probabilidade?.

Para calcular intervalos de confiança, a aproximação gaussiana, $p \pm 1.96 \times \sqrt{p(1-p)/n}$ (1,96 sendo o quantil da distribuição normal padrão em $p=0.975$ ou $1-\alpha/2$ com $\alpha=5$ %), é usado na prática, especialmente quando as proporções são muito pequenas ou grandes (o que geralmente acontece aqui).

Para referência adicional, você pode ver

Newcombe, RG. Intervalos de confiança frente e verso para uma única proporção: comparação de sete métodos . Statistics in Medicine , 17, 857-872 (1998).

— chl
fonte

Obrigado. Ok, li no começo do artigo que eles usavam o teste do qui-quadrado para todas as variáveis categóricas. A tabela de classificação escrita não se refere a uma variável em particular, é a saída de uma tarefa de classificação. Não está muito claro! Agora eu suponho que eles fizeram um teste clássico em proporção .. talvez qui-quadrado ..

— Simone

Eu olhei para essa pergunta novamente e vi que o valor-p não se refere nem ao PPV nem ao NPV, mas sim à linha inteira. Eu acho que o teste que eles tiveram deve estar associado a toda a tabela de contingência.

— Simone

@ Simone Então, se eu entendi direito, você sugere que os autores forneçam valores de PPV e NPV, mas deram o valor p correspondente a um teste de associação global da tabela 2x2? Está relacionado a esta pergunta recente, stats.stackexchange.com/questions/9464/… ?

— chl

Sim, estaria relacionado a essa pergunta se o valor de p estivesse associado ao VPP ou ao VPN. E nesse caso, você deu a solução. O teste corresponde a toda a tabela 2x2, nunca vou saber que tipo de teste é!

— Simone

Por favor, veja

Kosinski, Andrzej S. Uma estatística de pontuação generalizada ponderada para comparação dos valores preditivos dos testes de diagnóstico. Statistics in Medicine http://dx.doi.org/10.1002/sim.5587 publicado on-line: 22 de agosto de 2012

— Andrzej Kosinski
fonte