Pedimos desculpas antecipadamente se qualquer uma das terminologias utilizadas estiver incorreta. Eu gostaria de receber qualquer correção. Se o que eu descrevo como "corte" tiver um nome diferente, informe-me e eu posso atualizar a pergunta.
A situação em que estou interessado é: você tem variáveis independentes e uma única variável dependente y . Vou deixar isso vago, mas suponha que seria relativamente simples obter um bom modelo de regressão para essas variáveis.
No entanto, o modelo que você pretende criar é para variáveis independentes e variável dependente w = min ( y , a ) , em que a é algum valor fixo no intervalo de y . Da mesma forma, os dados aos quais você tem acesso não incluem y , apenas w .
Um exemplo (um tanto irreal) disso seria se você estivesse tentando modelar por quantos anos as pessoas receberão sua pensão. Nesse caso, pode ser uma informação relevante, como sexo, peso, horas de exercício por semana, etc. A variável "subjacente" y seria a expectativa de vida. No entanto, a variável que você teria acesso e tentaria prever em seu modelo seria w = min ( 0 , y - r ) em que r é a idade da aposentadoria (assumindo que a simplicidade é fixa).
Existe uma boa abordagem para lidar com isso na modelagem de regressão?