Como ouvi falar do classificador AdaBoost mencionado repetidamente no trabalho, queria ter uma idéia melhor de como ele funciona e quando alguém pode usá-lo. Fui em frente e li vários artigos e tutoriais que encontrei no Google, mas há aspectos do classificador que ainda estou tendo problemas para entender:
A maioria dos tutoriais que vi falam do AdaBoost como a melhor combinação ponderada de muitos classificadores. Isso faz sentido para mim. O que não faz sentido são implementações (por exemplo, MALLET) em que o AdaBoost parece aceitar apenas um aluno fraco. Como isso faz algum sentido? Se houver apenas um classificador fornecido ao AdaBoost, ele não deve retornar o mesmo classificador com um peso de 1? Como ele produz novos classificadores a partir do primeiro classificador?
Quando alguém realmente gostaria de usar o AdaBoost? Eu li que ele deveria ser um dos melhores classificadores prontos para uso, mas quando tento aprimorar um classificador MaxEnt, obtive f-score de 70% + com o AdaBoost o mata e me dá f- pontuações de algo como 15% com recall muito alto e precisão muito baixa. Então agora estou confuso. Quando eu gostaria de usar o AdaBoost? Estou procurando uma resposta mais intuitiva do que estritamente estatística, se possível.