Entendo o conceito de escalar a matriz de dados para usar em um modelo de regressão linear. Por exemplo, em R você pode usar:
scaled.data <- scale(data, scale=TRUE)
Minha única pergunta é, para novas observações para as quais quero prever os valores de saída, como elas são dimensionadas corretamente? Seria scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, mas isso interferiria nas propriedades do modelo, acho, então também estou esperando uma resposta mais técnica!