Percebo que existem 3 parâmetros de ajuste no modelo de árvores de reforço, ou seja,
- o número de árvores (número de iterações)
- parâmetro de encolhimento
- número de divisões (tamanho de cada árvore constituinte)
Minha pergunta é: para cada um dos parâmetros de ajuste, como devo encontrar seu valor ideal? E qual método?
Observe que: o parâmetro de encolhimento e o número de árvores funcionam juntos, ou seja, um valor menor para o parâmetro de encolhimento leva a um valor mais alto para o número de árvores. E precisamos levar isso em conta também.
Estou particularmente interessado no método para encontrar o valor ideal para o número de divisões. Deve ser baseado em validação cruzada ou conhecimento de domínio sobre o modelo por trás?
E como essas coisas são realizadas no gbm
pacote em R?