O principal motivo é que o estimador de validação cruzada com dobra k tem uma variação menor do que um único estimador de conjunto de espera, o que pode ser muito importante se a quantidade de dados disponíveis for limitada. Se você tiver um único conjunto de espera, em que 90% dos dados são usados para treinamento e 10% usados para teste, o conjunto de testes é muito pequeno, portanto haverá muita variação na estimativa de desempenho para diferentes amostras de dados, ou para diferentes partições dos dados para formar conjuntos de treinamento e teste. A validação k-fold reduz essa variação calculando a média de k diferentes partições, portanto, a estimativa de desempenho é menos sensível ao particionamento dos dados. Você pode ir ainda mais longe através da validação cruzada repetida de dobras k, em que a validação cruzada é realizada usando particionamentos diferentes dos dados para formar k subconjuntos,
Observe, no entanto, todas as etapas do procedimento de ajuste de modelo (seleção de modelo, seleção de recurso etc.) devem ser executadas independentemente em cada dobra do procedimento de validação cruzada, ou a estimativa de desempenho resultante será otimizada de maneira otimista.