Realmente depende da quantidade de dados que você possui, do custo específico dos métodos e de como exatamente você deseja que seu resultado seja.
Alguns exemplos:
Se você tem poucos dados, provavelmente deseja usar a validação cruzada (dobra em k, deixar um para fora, etc.) Seu modelo provavelmente não precisará de muitos recursos para treinar e testar de qualquer maneira. São boas maneiras de aproveitar ao máximo seus dados
Você tem muitos dados: provavelmente deseja fazer um conjunto de testes razoavelmente grande, garantindo que haja pouca possibilidade de que algumas amostras estranhas dêem muita variação aos seus resultados. Quantos dados você deve levar? Depende completamente dos seus dados e modelo. No reconhecimento de fala, por exemplo, se você usar muitos dados (digamos 3000 frases), seus experimentos levarão dias, já que um fator em tempo real de 7 a 10 é comum. Se você tomar muito pouco, isso dependerá muito dos alto-falantes que você escolher (o que não é permitido no conjunto de treinamento).
Lembre-se também, em muitos casos, é bom ter uma validação / desenvolvimento definido também!