Como um classificador de conjunto mescla as previsões de seus classificadores constituintes? Estou tendo dificuldade em encontrar uma descrição clara. Em alguns exemplos de código que encontrei, o conjunto apenas calcula a média das previsões, mas não vejo como isso poderia fazer uma precisão geral "melhor".
Considere o seguinte caso. Um classificador de conjunto é composto por 10 classificadores. Um classificador possui uma precisão de 100% do tempo no subconjunto de dados X e 0% em todos os outros momentos. Todos os outros classificadores têm uma precisão de 0% no subconjunto de dados X e 100% em todos os outros momentos.
Usando uma fórmula de média, em que a precisão do classificador é ignorada, o classificador de conjunto teria, na melhor das hipóteses, 50% de precisão. Isso está correto ou estou faltando alguma coisa? Como a previsão média de N classificadores potencialmente sem noção pode criar uma previsão melhor que um único classificador especialista em um domínio específico?