Achei isso confuso quando uso a caixa de ferramentas de redes neurais no Matlab.
Ele dividiu o conjunto de dados brutos em três partes:
- conjunto de treinamento
- conjunto de validação
- Conjunto de teste
Percebo que em muitos algoritmos de treinamento ou aprendizado, os dados geralmente são divididos em duas partes, o conjunto de treinamento e o conjunto de teste.
Minhas perguntas são:
- qual é a diferença entre conjunto de validação e conjunto de teste?
- O conjunto de validação é realmente específico da rede neural? Ou é opcional.
- Para ir além, existe uma diferença entre validação e teste no contexto do aprendizado de máquina?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.