Li que a validação cruzada de deixar um fora fornece uma “estimativa imparcial do verdadeiro desempenho da generalização” (por exemplo, aqui ) e que essa é uma propriedade vantajosa do CV de deixar um fora.
No entanto, não vejo como isso decorre das propriedades do CV individual. Por que o viés desse estimador é baixo quando comparado a outros?
Atualizar:
Eu continuo investigando o tópico e acredito que tem a ver com o fato de que esse estimador é menos pessimista do que, digamos, a validação K-fold, já que ele usa todos os dados, exceto uma instância, mas seria ótimo ler um relatório matemático derivação disso.