Os dados estão "ausentes" no sentido de serem desconhecidos ou apenas significam que não há empréstimo (portanto, o valor do empréstimo é zero)? Parece o último, caso em que você precisa de um manequim binário adicional para indicar se existe um empréstimo. Não é necessária nenhuma transformação do montante do empréstimo (além de uma reexpressão contínua, como um log raiz ou iniciado, que pode ser indicado em virtude de outras considerações).
Isso funciona bem em uma regressão. Um exemplo simples é um modelo conceitual do formulário
dependent variable (Y) = loan amount (X) + constant.
Com a adição de um indicador de empréstimo ( ), o modelo de regressão éI
Y=βII+βXX+β0+ϵ
com representando erros aleatórios com zero expectativas. Os coeficientes são interpretados como:ϵ
β0 é a expectativa de para situações sem empréstimo, porque essas são caracterizadas por e .YX=0I=0
βX é a alteração marginal em em relação ao valor do empréstimo ( ).YX
βI+β0 é a interceptação para os casos com empréstimos.