Minhas perguntas são sobre florestas aleatórias. O conceito deste classificador bonito é claro para mim, mas ainda há muitas questões práticas de uso. Infelizmente, não encontrei nenhum guia prático de RF (estive procurando por algo como "Um Guia Prático para Treinamento de Máquinas Boltzman Restritas", de Geoffrey Hinton, mas para as Florestas Aleatórias!
Como se pode ajustar a RF na prática?
É verdade que um número maior de árvores é sempre melhor? Existe um limite razoável (exceto a capacidade comp, é claro) para aumentar o número de árvores e como estimar para um determinado conjunto de dados?
E a profundidade das árvores? Como escolher o razoável? Existe algum sentido em experimentar árvores de diferentes comprimentos em uma floresta e qual é a orientação para isso?
Existem outros parâmetros que vale a pena observar ao treinar RF? Algos para a construção de árvores individuais pode ser?
Quando eles dizem que os RF são resistentes ao excesso de ajuste, qual é a verdade?
Aprecio todas as respostas e / ou links para guias ou artigos que eu possa ter perdido durante a minha pesquisa.