Suponha que eu tenha um tamanho pequeno de amostra, por exemplo, N = 100 e duas classes. Como devo escolher os tamanhos de treinamento, validação cruzada e conjunto de testes para aprendizado de máquina?
Eu escolheria intuitivamente
- Tamanho do conjunto de treinamento como 50
- Conjunto de validação cruzada tamanho 25 e
- Teste o tamanho como 25.
Mas provavelmente isso faz mais ou menos sentido. Como devo realmente decidir esses valores? Posso tentar opções diferentes (embora eu ache que não é tão preferível ... maior possibilidade de mais aprendizado)?
E se eu tivesse mais de duas aulas?