Na construção do modelo de crédito, a dedução de rejeição é o processo de inferir o desempenho das contas de crédito que foram rejeitadas no processo de inscrição.
Quando a construção de um modelo de risco de crédito aplicação, queremos construir um modelo que tem " through-the-door aplicabilidade", ou seja, nós entrada de todos os dados de aplicativos para o modelo de risco de crédito, e o modelo gera uma classificação de risco ou uma probabilidade do padrão. O problema ao usar a regressão para criar um modelo a partir de dados passados é que conhecemos o desempenho da conta apenas para aplicativos aceitos no passado. No entanto, não sabemos o desempenho dos rejeitados, porque, após a aplicação, os enviamos de volta pela porta. Isso pode resultar em viés de seleção em nosso modelo, porque, se usarmos apenas "aceita" no passado, o modelo poderá não ter um bom desempenho na população "através da porta".
Existem muitas maneiras de lidar com a inferência de rejeição, todas elas controversas. Vou mencionar dois simples aqui.
- "Definir rejeições passadas como ruins"
- Parceling
"Definir rejeições passadas como ruins" é simplesmente pegar todos os dados de aplicativos rejeitados e, em vez de descartá-los ao criar o modelo, atribua todos eles como ruins. Esse método influencia fortemente o modelo em relação à política de aceitação / rejeição do passado.
"Parcelar" é um pouco mais sofisticado. Isso consiste de
- Construa o modelo de regressão com o passado "aceita"
- Aplique o modelo às rejeições anteriores para atribuir classificações de risco a elas
- Usando a probabilidade esperada de inadimplência para cada classificação de risco, atribua os aplicativos rejeitados a serem bons ou ruins. Por exemplo, se a classificação de risco tiver uma probabilidade de inadimplência de 10% e houver 100 aplicativos rejeitados que se enquadram nessa classificação de risco, atribua 10 das rejeições como "ruins" e 90 das rejeições como "boas".
- Reconstrua o modelo de regressão usando os aplicativos aceitos e agora o desempenho inferido dos aplicativos rejeitados
Existem diferentes maneiras de executar as atribuições como boas ou ruins na etapa 3, e esse processo também pode ser aplicado iterativamente.
Como afirmado anteriormente, o uso de inferências por rejeição é controverso e é difícil dar uma resposta direta sobre como pode ser usada para aumentar a precisão dos modelos. Vou simplesmente citar alguns outros sobre esse assunto.
Jonathan Crook e John Banasik, rejeitar a inferência realmente melhora o desempenho dos modelos de pontuação de aplicativos?
Primeiro, mesmo quando uma proporção muito grande de candidatos é rejeitada, o escopo de melhoria de um modelo parametrizado apenas para os aceitos parece modesto. Onde a taxa de rejeição não é tão grande, esse escopo parece ser realmente muito pequeno.
David Hand, "Inferência direta em operações de crédito", publicado no Handbook of Credit Scoring, 2001
Vários métodos foram propostos e são utilizados e, embora alguns sejam claramente ruins e nunca devam ser recomendados, não existe o melhor método único de aplicabilidade universal, a menos que informações adicionais sejam obtidas. Ou seja, a melhor solução é obter mais informações (talvez concedendo empréstimos a alguns possíveis rejeitados) sobre os candidatos que se enquadram na região de rejeitos.