Digamos que eu tenha um problema simples de aprendizado de máquina, como uma classificação. Com algumas referências em visão ou reconhecimento de áudio, eu, como humano, sou um classificador muito bom. Portanto, tenho uma intuição de quão bom um classificador pode ser.
Mas com muitos dados, um ponto é que eu não sei como é possível obter o classificador que treino. Esses são dados em que eu pessoalmente não sou um classificador muito bom (digamos, classifique o humor de uma pessoa a partir dos dados de EEG). Não é realmente possível ter uma intuição sobre a dificuldade do meu problema.
Agora, se eu me deparar com um problema de aprendizado de máquina, gostaria de descobrir o quanto posso ser bom. Existem abordagens de princípios para isso? Como você faria isso?
Visualizar dados? Comece com modelos simples? Comece com modelos muito complexos e veja se consigo me superestimar? O que você está procurando se quiser responder a esta pergunta? Quando você para de tentar?