Resposta curta
Os CARROS precisam de ajuda para capturar interações.
Resposta longa
Pegue o algoritmo guloso exato (Chen e Guestrin, 2016):
A média na folha será uma expectativa condicional, mas cada divisão no caminho para a folha é independente da outra. Se o Recurso A não importa por si só, mas importa em interação com o Recurso B, o algoritmo não será dividido no Recurso A. Sem essa divisão, o algoritmo não pode prever a divisão no Recurso B, necessária para gerar a interação.
As árvores podem escolher interações nos cenários mais simples. Se você tiver um conjunto de dados com dois recursos e o destino , o algoritmo não terá nada para dividir, exceto e , portanto, você obterá quatro folhas com o estimado adequadamente.x1 1, x2y= XO R ( x1 1, x2)x1 1x2XO R
Com muitos recursos, regularização e o limite rígido do número de divisões, o mesmo algoritmo pode omitir interações.
Soluções alternativas
Interações explícitas como novos recursos
Um exemplo de Zhang ("Winning Data Science Competitions", 2015):
Algoritmos de árvore não gananciosos
Na outra questão, Simone sugere algoritmos baseados em lookahead e árvores de decisão oblíquas .
Uma abordagem de aprendizado diferente
Alguns métodos de aprendizado lidam melhor com as interações.
Aqui está uma tabela de The Elements of Statistical Learning (linha "Capacidade de extrair combinações lineares de recursos"):