Venho acompanhando as competições do Kaggle há muito tempo e percebo que muitas estratégias de vitória envolvem o uso de pelo menos uma das "três grandes" qualidades: empacotar, aumentar e empilhar.
Para as regressões, em vez de se concentrar na construção de um melhor modelo de regressão possível, a criação de vários modelos de regressão, como regressão linear (generalizada), floresta aleatória, modelos de regressão KNN, NN e SVM e mesclar os resultados em um de maneira razoável parece -executar cada método individual várias vezes.
Obviamente, uma sólida compreensão de cada método é a chave e uma história intuitiva pode ser contada com base em um modelo de regressão linear, mas estou me perguntando se isso se tornou a metodologia do estado da arte para obter os melhores resultados possíveis.