O aprendizado computacional, mais concretamente a estrutura provavelmente aproximadamente correta ( PAC ), responde a perguntas como: quantos exemplos de treinamento são necessários para um aluno aprender com alta probabilidade uma boa hipótese? quanto esforço computacional eu preciso aprender com alta probabilidade de tal hipótese? Ele não lida com o classificador concreto com o qual você está trabalhando. É sobre o que você pode e não pode aprender com algumas amostras em mãos.
Na teoria da aprendizagem estatística, você prefere responder a perguntas do tipo: quantas amostras de treinamento o classificador classificará incorretamente antes de convergir para uma boa hipótese? ou seja, quão difícil é treinar um classificador e que garantias tenho sobre seu desempenho?
Lamentavelmente, não conheço uma fonte em que essas duas áreas sejam descritas / comparadas de maneira unificada. Ainda assim, embora não haja muita esperança que ajude