Vou listar algumas propriedades e, posteriormente, fazer uma avaliação do valor:
- O CHAID usa divisões de várias vias por padrão (as divisões de várias vias significam que o nó atual é dividido em mais de dois nós). Isso pode ou não ser desejado (pode levar a melhores segmentos ou interpretação mais fácil). O que definitivamente faz, porém, é diminuir o tamanho da amostra nos nós e, assim, levar a árvores menos profundas. Quando usado para fins de segmentação, isso pode sair pela culatra logo que o CHAID precise de um tamanho de amostra grande para funcionar bem. O CART faz divisões binárias (cada nó é dividido em dois nós filhos) por padrão.
- O CHAID destina-se a trabalhar com destinos categóricos / discretizados (o XAID foi para regressão, mas talvez eles tenham sido mesclados desde então). Definitivamente, o CART pode fazer regressão e classificação.
- CHAID usa uma ideia de poda . Um nó é dividido apenas se um critério de significância for atendido. Isso está relacionado ao problema acima de precisar de amostras grandes, pois o teste do qui-quadrado tem pouco poder em amostras pequenas (o que é efetivamente reduzido ainda mais por uma correção de Bonferroni para testes múltiplos). O CART, por outro lado, cresce uma árvore grande e depois poda a árvore novamente para uma versão menor.
- Assim, o CHAID tenta evitar o ajuste excessivo desde o início (apenas a divisão existe associação significativa), enquanto o CART pode se ajustar facilmente , a menos que a árvore seja removida. Por outro lado, isso permite que o CART tenha um desempenho melhor que o CHAID dentro e fora da amostra (para uma dada combinação de parâmetros de ajuste).
- A diferença mais importante na minha opinião é que a seleção da variável dividida e do ponto de divisão no CHAID é menos fortemente confundida como no CART . Isso é amplamente irrelevante quando as árvores são usadas para previsão, mas é uma questão importante quando as árvores são usadas para interpretação: Diz-se que uma árvore que tem essas duas partes do algoritmo altamente confusas é "enviesada na seleção de variáveis" (um nome infeliz). . Isso significa que a seleção de variáveis divididas prefere variáveis com muitas divisões possíveis (por exemplo, preditores de métricas). A CART é altamente "tendenciosa" nesse sentido, CHAID não muito.
- Com divisões substitutas, o CART sabe como lidar com valores ausentes (divisões substitutas significa que, com valores ausentes (NAs) para variáveis preditoras), o algoritmo usa outras variáveis preditoras que não são tão "boas" quanto a variável dividida primária, mas imitam as divisões produzidas pela primária divisor). CHAID não tem nada disso.
Portanto, dependendo do que você precisar, sugiro usar CHAID se a amostra tiver algum tamanho e os aspectos de interpretação forem mais importantes. Além disso, se se deseja divisões com várias vias ou árvores menores, o CHAID é melhor. O CART, por outro lado, é uma máquina de previsão que funciona bem, portanto, se a previsão é o seu objetivo, eu usaria o CART.