A principal diferença entre interpolação e regressão é a definição do problema que eles resolvem.
Dados pontos de dados, quando você interpola, procura uma função que tenha alguma forma predefinida que tenha os valores nesses pontos exatamente como especificado. Isso significa que, dado pares ( x i , y i ), você procura F de alguma forma predefinida que satisfaça F ( x i ) = y i . Eu acho que mais comumente Fn( xEu, yEu)FF( xEu) = yEuF é escolhido para ser polinomial, spline (polinômios de baixo grau em intervalos entre os pontos indicados).
Ao fazer a regressão, você procura uma função que minimize algum custo, geralmente a soma dos quadrados dos erros. Você não precisa que a função tenha os valores exatos em determinados pontos, apenas deseja uma boa aproximação. Em geral, a função encontrada pode não satisfazer F ( x i ) = y i para qualquer ponto de dados, mas a função de custo, ou seja, ∑ n i = 1 ( F ( x i ) - y i ) 2FF( xEu) = yEu∑ni = 1( F( xEu) - yEu)2 será a menor possível de todas as funções de determinada forma.
Um bom exemplo de por que você pode querer aproximar apenas em vez de interpolar são os preços no mercado de ações. Você pode obter preços em algumas unidades de tempo recentes e tentar interpolar-los para obter uma previsão do preço na próxima unidade de tempo. Essa é uma péssima idéia, porque não há razão para pensar que as relações entre os preços possam ser exatamente expressas por um polinômio. Mas a regressão linear pode funcionar, já que os preços podem ter alguma "inclinação" e uma função linear pode ser uma boa aproximação, pelo menos localmente (dica: não é tão fácil, mas a regressão é definitivamente uma idéia melhor do que a interpolação neste caso )k