A função ROC (não é necessariamente uma curva) permite avaliar a capacidade de discriminação fornecida por um modelo estatístico específico (composto por uma variável preditora ou um conjunto deles).
Uma consideração principal dos ROCs é que as previsões do modelo não derivam apenas da capacidade do modelo de discriminar / fazer previsões com base nas evidências fornecidas pelas variáveis preditoras. Também está em operação um critério de resposta que define quanta evidência é necessária para o modelo prever uma resposta e qual é o resultado dessas respostas. O valor estabelecido para os critérios de resposta influenciará bastante as previsões do modelo e, finalmente, o tipo de erro que ele cometerá.
Considere um modelo genérico com variáveis preditivas e um critério de resposta. Este modelo está tentando prever a presença de X, respondendo Sim ou Não. Portanto, você tem a seguinte matriz de confusão:
**X present X absent**
**Model Predicts X Present** Hit False Alarm
**Model Predicts X Absent** Miss Correct Rejection
Nesta matriz, você só precisa considerar a proporção de batidas e alarmes falsos (porque as outras podem ser derivadas delas, considerando que elas precisam de 1 a 1). Para cada critério de resposta, você terá uma matriz de confusão diferente. Os erros (erros e alarmes falsos) estão relacionados negativamente, o que significa que um critério de resposta que minimiza alarmes falsos maximiza erros e vice-versa. A mensagem é: não há almoço grátis.
Portanto, para entender quão bem o modelo discrimina casos / faz previsões, independentemente dos critérios de resposta estabelecidos, você plota as taxas de Hits e False produzidas no intervalo de possíveis critérios de resposta.
O que você obtém desse gráfico é a função ROC. A área sob a função fornece uma medida imparcial e não paramétrica da capacidade de discriminação do modelo. Essa medida é muito importante porque está livre de qualquer confusão que poderia ter sido produzida pelos critérios de resposta.
Um segundo aspecto importante é que, analisando a função, é possível definir quais critérios de resposta são melhores para seus objetivos. Quais tipos de erros você deseja evitar e quais são os erros são válidos. Por exemplo, considere um teste de HIV: é um teste que busca algum tipo de evidência (neste caso, anticorpos) e faz uma discriminação / previsão com base na comparação da evidência com o critério de resposta. Esse critério de resposta geralmente é definido como muito baixo, para minimizar perdas. Obviamente, isso resultará em mais alarmes falsos, que têm um custo, mas um custo que é insignificante quando comparado aos erros.
Com os ROCs, você pode avaliar a capacidade de discriminação de alguns modelos, independentemente dos critérios de resposta, e também estabelecer os critérios de resposta ideais, dadas as necessidades e restrições do que quer que esteja medindo. Testes como o hi-square não podem ajudar nisso porque, mesmo que o seu teste se as previsões estão no nível de chance, muitos pares diferentes de alarme falso-falso são consistentes com o nível de chance.
Algumas estruturas, como a teoria de detecção de sinal, assumem a priori que as evidências disponíveis para discriminação têm distribuição específica (por exemplo, distribuição normal ou distribuição gama). Quando essas premissas se mantêm (ou são bem próximas), algumas medidas realmente boas estão disponíveis para facilitar sua vida.
espero que isso ajude a elucidar você sobre as vantagens dos ROCs