Normalmente, é claro que a diferença é imperceptível, e a minha pergunta continua - você pode pensar em um exemplo quando o resultado de um tipo é significativamente diferente de outro?
Não tenho certeza de que a diferença seja imperceptível e que apenas em um exemplo ad hoc será perceptível. Os métodos de validação cruzada e de bootstrapping (subamostragem) dependem criticamente de seus parâmetros de design, e esse entendimento ainda não está completo. Em geral, os resultados na validação cruzada de dobras k dependem criticamente do número de dobras, portanto, você pode esperar sempre resultados diferentes dos que você observaria na subamostragem.
Caso em questão: digamos que você tenha um modelo linear verdadeiro com um número fixo de parâmetros. Se você usar a validação cruzada de dobras k (com um determinado k fixo) e deixar o número de observações chegar ao infinito, a validação cruzada de dobras k será assintoticamente inconsistente para a seleção do modelo, ou seja, identificará um modelo incorreto com probabilidade maior que 0. Esse resultado surpreendente é devido a Jun Shao, "Seleção de Modelo Linear por Validação Cruzada", Journal of American Statistical Association , 88 , 486-494 (1993), mas mais artigos podem ser encontrados nesse sentido.
Em geral, artigos estatísticos respeitáveis especificam o protocolo de validação cruzada, exatamente porque os resultados não são invariáveis. No caso em que eles escolhem um grande número de dobras para grandes conjuntos de dados, eles observam e tentam corrigir vieses na seleção do modelo.