Estou tentando resolver a tarefa de regressão. Descobri que três modelos estão funcionando bem para diferentes subconjuntos de dados: LassoLARS, SVR e Gradient Tree Boosting. Percebi que quando faço previsões usando todos esses três modelos e, em seguida, faço uma tabela de 'saída verdadeira' e saídas dos meus três modelos, vejo que cada vez que pelo menos um dos modelos está realmente próximo da saída real, embora outros dois poderia estar relativamente longe.
Quando eu calculo o erro possível mínimo (se eu usar a previsão do 'melhor' preditor para cada exemplo de teste), recebo um erro muito menor que o erro de qualquer modelo sozinho. Então, pensei em tentar combinar as previsões desses três modelos diferentes em algum tipo de conjunto. A questão é: como fazer isso corretamente? Todos os meus três modelos são construídos e ajustados usando o scikit-learn, ele fornece algum tipo de método que pode ser usado para agrupar modelos em conjunto? O problema aqui é que eu não quero apenas previsões médias dos três modelos. Quero fazer isso com ponderação, em que a ponderação deve ser determinada com base nas propriedades de um exemplo específico.
Mesmo que o scikit-learn não ofereça essa funcionalidade, seria bom se alguém soubesse como resolver essa tarefa - de descobrir o peso de cada modelo para cada exemplo nos dados. Eu acho que isso pode ser feito por um regressor separado, construído sobre todos esses três modelos, que tentará produzir pesos ideais para cada um dos três modelos, mas não tenho certeza se essa é a melhor maneira de fazer isso.