Tento prever uma pontuação de equilíbrio e tentei vários métodos de regressão diferentes. Uma coisa que notei é que os valores previstos parecem ter algum tipo de limite superior. Ou seja, o saldo real está em , mas minhas previsões atingem cerca de . O gráfico a seguir mostra o saldo real versus o previsto (previsto com regressão linear):0,8
E aqui estão dois gráficos de distribuição dos mesmos dados:
Como meus preditores são muito distorcidos (dados do usuário com distribuição da lei de energia), apliquei uma transformação Box-Cox, que altera os resultados para o seguinte:
Embora mude a distribuição das previsões, ainda existe esse limite superior. Então, minhas perguntas são:
- Quais são as possíveis razões para esses limites superiores nos resultados de previsão?
- Como posso corrigir as previsões para corresponder à distribuição dos valores reais?
Bônus: Como a distribuição após a transformação Box-Cox parece seguir as distribuições dos preditores transformados, é possível que isso esteja diretamente vinculado? Se sim, existe uma transformação que eu possa aplicar, para ajustar a distribuição aos valores reais?
Edit: Eu usei uma regressão linear simples com 5 preditores.