[Nota: veja a atualização 1. abaixo.] Acho que a metodologia para rpart
é muito mais fácil de explicar do que party
. Este último, no entanto, é muito mais sofisticado e provavelmente dará melhores modelos. A maneira como explico às vezes party
é falar disso como base para a produção de modelos lineares locais (ou GLM). Eu construo isso apontando que os resultados pararpart
são constantes em todos os elementos que caem no nó da folha, ou seja, na caixa / região delimitada pelas divisões. Mesmo que haja melhorias através de modelos locais, você não recebe nada além de uma previsão constante.
Em contraste, party
desenvolve as divisões para otimizar potencialmente os modelos para as regiões. Na verdade, ele está usando um critério diferente da otimização do modelo, mas é necessário avaliar sua própria capacidade de explicar a diferença para determinar se você pode explicá-la bem. Os artigos para ele são bastante acessíveis para um pesquisador, mas podem ser bastante desafiadores para alguém que não está disposto a considerar métodos mais simples, como florestas aleatórias, reforço etc. Matematicamente, acho queparty
é mais sofisticado ... No entanto, os modelos CART são mais fáceis de explique, tanto em termos de metodologia quanto de resultados, e estes são um trampolim decente para a introdução de modelos baseados em árvores mais sofisticados.
Em resumo, eu diria que você tem que ter rpart
clareza e pode usar party
para precisão / desempenho, mas eu não apresentaria party
sem a introdução rpart
.
Atualização 1. Baseei minha resposta no meu entendimento de party
como era um ano ou dois atrás. Ele cresceu bastante, mas eu modificaria minha resposta para dizer que ainda recomendaria rpart
por sua brevidade e legado, caso "não-sofisticado" seja um critério importante para seu cliente / colaborador. No entanto, eu tentaria migrar para o uso de mais funcionalidades party
, depois de apresentar alguém rpart
. É melhor começar pequeno, com funções de perda, critérios de divisão etc., em um contexto simples, antes de introduzir um pacote e uma metodologia que envolvam conceitos muito mais envolvidos.