Estou tentando prever uma variável de resposta na regressão linear que deve ser sempre positiva (custo por clique). É uma quantia monetária. No adwords, você paga ao google pelos cliques nos seus anúncios, e um número negativo significa que o google paga quando as pessoas clicam: P
Os preditores são todos valores contínuos. O Rsquared e o RMSE são decentes quando comparados a outros modelos, mesmo fora da amostra:
RMSE Rsquared
1.4141477 0.8207303
Não posso redimensionar as previsões, porque é dinheiro, portanto, mesmo um pequeno fator de redimensionamento pode alterar os custos significativamente.
Até onde eu entendo, para o modelo de regressão não há nada de especial em números zero e negativos; portanto, ele encontra o melhor hiperplano de regressão, independentemente de a saída ser parcialmente negativa.
Esta é uma primeira tentativa, usando todas as variáveis que tenho. Portanto, há espaço para aperfeiçoamento.
Existe alguma maneira de dizer ao modelo que a saída não pode ser negativa?