Questões:
- Qual é a diferença (ões) entre árvores de regressão reforçada (BRT) e modelos impulsionados generalizados (GBM)? Eles podem ser usados de forma intercambiável? Uma é uma forma específica da outra?
- Por que Ridgeway usou a frase "Generalized Boosted Regression Models" (GBM), para descrever o que Friedman havia proposto anteriormente como "Gradient Boosting Machine" (GBM)? Essas duas siglas são idênticas, descrevem a mesma coisa, mas derivam de frases diferentes.
Fundo:
Estou com problemas para determinar como os termos BRT e GBM diferem. Pelo que entendi, ambos são termos para descrever árvores de classificação e regressão que tenham estocticidade incorporada através de algum tipo de reforço (por exemplo, ensacamento, inicialização, validação cruzada). Além disso, pelo que entendi o termo GBM foi cunhado pela primeira vez por Friedman (2001) em seu artigo "Aproximação de função gananciosa: uma máquina de aumento de gradiente". Ridgeway implementou o procedimento descrito por Friedman em 2006 em seu pacote "Generalized Boosted Regression Models" (GBM). No meu campo (ecologia), Elith et al. (2008) foi o primeiro a demonstrar o gbm
pacote de Ridgeway para modelagem de distribuição de espécies. No entanto, os autores de Elith et al. use o termo "árvore de regressão reforçada" (BRT) para descrever Friedman e Ridgeway '
Estou confuso quanto a se esses termos podem ser usados de forma intercambiável? É um pouco confuso que um autor usaria o mesmo acrônimo (de uma frase diferente) para descrever a mesma teoria que um autor anterior propôs. Também é confuso que o terceiro autor tenha usado um termo completamente diferente ao descrever essa teoria em termos ecológicos.
O melhor que posso sugerir é que o BRT é uma forma específica de GBM na qual a distribuição é binomial, mas não tenho certeza disso.
Elith et al. definir árvores de regressão reforçada como esta ... "As árvores de regressão reforçada combinam os pontos fortes de dois algoritmos: árvores de regressão (modelos que relacionam uma resposta aos seus preditores por divisões binárias recursivas) e boosting (um método adaptativo para combinar muitos modelos simples para fornecer desempenho preditivo aprimorado O modelo final de BRT pode ser entendido como um modelo de regressão aditivo, no qual termos individuais são árvores simples, ajustadas de maneira estagiária e direta "(Elith et al. 2008).