No gráfico abaixo,
- eixo x => Tamanho do conjunto de dados
- eixo y => Pontuação da validação cruzada
A linha vermelha é para dados de treinamento
A linha verde é para testar dados
Em um tutorial ao qual estou me referindo, o autor diz que o ponto em que a linha vermelha e a linha verde se sobrepõem significa,
É improvável que coletar mais dados aumente o desempenho da generalização e estamos em uma região que provavelmente subestimaremos os dados. Portanto, faz sentido experimentar um modelo com mais capacidade
Não consigo entender direito o significado da frase em negrito e como ela acontece.
Aprecio qualquer ajuda.