Eu estava lendo o material relacionado ao XGBoost. Parece que esse método não requer escala variável, pois é baseado em árvores e pode capturar interações complexas de padrões de não linearidade. E ele pode lidar com variáveis numéricas e categóricas e também parece que variáveis redundantes não afetam muito esse método.
Geralmente, na modelagem preditiva, você pode fazer uma seleção entre todos os recursos que possui e também pode criar alguns novos recursos a partir do conjunto de recursos que possui. Portanto, selecionar um subconjunto de recursos significa que você acha que há alguma redundância em seu conjunto de recursos; criar alguns novos recursos do conjunto de recursos atual significa que você faz algumas transformações funcionais nos recursos atuais. Então, esses dois pontos devem ser abordados no XGBoost. Então, isso significa que, para usar o XGBoost, você só precisa escolher esses parâmetros de sintonia sabiamente? Qual é o valor de fazer engenharia de recursos usando o XGBoost?