Esta questão é sobre a estimativa de pontos de corte em um questionário de triagem multidimensional para prever um endpoint binário, na presença de escalas correlatas.
Perguntaram-me sobre o interesse de controlar os subescores associados ao criar pontuações de corte em cada dimensão de uma escala de medida (traços de personalidade) que possam ser usadas para a triagem do alcoolismo. Ou seja, nesse caso em particular, a pessoa não estava interessada em ajustar covariáveis externas (preditores) - o que leva a área (parcial) sob a curva ROC ajustada covariada, por exemplo (1-2) -, mas essencialmente em outras pontuações do mesmo questionário, porque eles se correlacionam (por exemplo, "impulsividade" com "busca de sensação"). Isso equivale a criar um GLM que inclua no lado esquerdo a pontuação de interesse (para a qual buscamos um ponto de corte) e outra pontuação calculada a partir do mesmo questionário, enquanto no lado direito o resultado pode estar no status de beber.
Para esclarecer (por solicitação do @robin), suponha que temos pontuações, digamos (por exemplo, ansiedade, impulsividade, neuroticismo, busca de sensações) e queremos encontrar um valor de corte (por exemplo, "caso positivo" se , "caso negativo" caso contrário) para cada um deles. Geralmente, ajustamos para outros fatores de risco, como sexo ou idade, ao conceber esse ponto de corte (usando a análise da curva ROC). Agora, que tal ajustar a impulsividade (IMP) no sexo, idade e busca por sensação (SS), já que se sabe que a SS se correlaciona com o IMP? Em outras palavras, teríamos um valor de corte para o IMP, onde os efeitos da idade, sexo e nível de ansiedade são removidos.
Além de dizer que um corte deve permanecer o mais simples possível, minha resposta foi
Sobre covariáveis, eu recomendaria estimar as AUCs com e sem ajuste, apenas para ver se o desempenho preditivo aumenta. Aqui, suas covariáveis são meramente outros subescores definidos a partir do mesmo instrumento de medição e eu nunca enfrentei essa situação (geralmente, eu ajusto fatores de risco conhecidos, como Idade ou Sexo). [...] Além disso, como você está interessado em questões prognósticas (por exemplo, eficácia da triagem do questionário), também pode estar interessado em estimar o valor preditivo positivo (VPP, probabilidade de pacientes com resultados positivos nos testes classificados corretamente) desde você pode classificar os assuntos como "positivos" ou "negativos", dependendo das subescores do questionário. Observe, no entanto,
Você tem um entendimento mais aprofundado dessa situação específica, com links para artigos relevantes, quando possível?
Referências
- Janes, H e Pepe, MS (2008). Ajustando para covariáveis em estudos de marcadores de diagnóstico, triagem ou prognóstico: um conceito antigo em um novo cenário . American Journal of Epidemiology , 168 (1): 89-97.
- Janes, H e Pepe, MS (2008). Acomodando covariáveis na análise ROC . UW Biostatistics Working Paper Series , Documento 322.