Eu tenho um problema de regressão linear. Em resumo, eu tenho um conjunto de dados, eu o dividi em dois subconjuntos. Um subconjunto é usado para encontrar a regressão linear (subconjunto de treinamento), outro é usado para avaliá-la (subconjunto de avaliação). Minha pergunta é como avaliar o resultado dessa regressão linear após aplicá-la ao subconjunto de dados de avaliação?
Aqui estão os detalhes:
No subconjunto de treinamento, faço regressão linear: , onde é a verdade básica (também conhecida como destino), é uma variável independente. Então eu encontrei e . ( e são fornecidos no subconjunto de treinamento).x a b x y
Agora, usando e encontrado acima do subconjunto de treinamento, aplicá-los para o subconjunto de avaliação, achei . Em outras palavras, esses são encontrados na regressão linear com . Agora, além de , eu também tenho do conjunto de avaliação. Como avalio meu resultado (quanto difere de )? Algum modelo matemático geral para fazer isso? Precisa ser algum tipo de modelo / fórmula matemática. Posso pensar em diferentes maneiras de fazer isso, mas elas são meio ad-hoc ou simples, mas isso é para um trabalho científico, então coisas que soam ad-hoc não podem ser usadas aqui, infelizmente.b y ′ = a x ′ + b y ′ x ′ y ′ y y ′ y
Qualquer ideia?