Se eu já encontrei a função de custo mínimo no subconjunto Validação, por que precisaria testá-lo novamente no subconjunto Teste
Devido a um erro aleatório: geralmente você tem apenas um número finito de casos.
A otimização do desempenho da validação (teste interno) significa que você pode estar adaptando-se a esse conjunto de testes interno. O conjunto de testes internos contribui para a estimativa do modelo final e, portanto, não é independente do modelo.
Isso significa que você precisa ter outro conjunto de testes (externo) independente de todo o procedimento de modelagem (incluindo todos os processos de otimização e pré-processamento orientado a dados ou de seleção de modelos) se desejar estimar as propriedades de generalização.
Eu recomendo que você faça uma simulação e compare as três estimativas de erro diferentes que você pode ter
- ressubstituição: a previsão do conjunto de trens
mede a qualidade do ajuste
- conjunto de teste interno (na sua nomenclatura: validação): a qualidade que o otimizador pensa que é alcançada
- conjunto de teste externo: erro de generalização, independente do treinamento do modelo.
Em uma simulação, você pode compará-los facilmente também com um conjunto de testes adequado, grande e gerado de forma independente. Se a configuração estiver correta, o teste externo deve ser imparcial (com base no modelo substituto que avalia, não com um modelo "final" construído em todo o conjunto de dados). O teste interno geralmente é tendenciosamente otimista, e a re-substituição é ainda mais otimista.
No meu campo, o teste interno subestimaria facilmente o erro de generalização por um fator de 2 a 5 (muito mais para esquemas de otimização agressivos).
Nota: a nomenclatura dos conjuntos não é universal. No meu campo (química analítica), a validação geralmente significaria a prova do desempenho do procedimento final - portanto, mais o que o seu conjunto de "testes" faz do que o seu conjunto de "validação".
Portanto, prefiro falar dos conjuntos de testes internos e externos ou do conjunto de testes de otimização (= conjunto de testes interno) e, em seguida, o conjunto de validação significaria o conjunto de testes externo.