O conjunto de dados se parece com:
- 25000 observações
- até 15 preditores de diferentes tipos: numérico, multi-classe categórica, binário
- variável de destino é binária
Qual método de validação cruzada é típico para esse tipo de problema?
Por padrão, estou usando o K-Fold. Quantas dobras é suficiente neste caso? (Um dos modelos que eu uso é a floresta aleatória, que consome tempo ...)