A primeira parte disso está basicamente correta - mas 64% da variação é explicada pelo modelo. Em uma regressão linear simples: Y ~ X, se é 0,64 isso significa que 64% da variação em Y é determinada pela relação linear entre Y e X. É possível ter uma forte relação com muito baixa R 2 , se o relacionamento for fortemente não linear.R2R2
Em relação às suas duas perguntas numeradas, nenhuma delas está correta. De fato, é possível que nenhum dos pontos esteja exatamente na linha de regressão. Não é isso que está sendo medido. Pelo contrário, é uma questão de quão próximo o ponto médio está da linha. Se todos ou quase todos os pontos estão perto (mesmo que nenhum deles está exatamente na linha), então será elevado. Se a maioria dos pontos estão longe de ser a linha, R 2 será baixo. Se a maioria dos pontos estiver próxima, mas alguns estiverem longe, a regressão está incorreta (problema de outliers). Outras coisas também podem dar errado.R2R2
Além disso, deixei a noção de "longe" bastante vaga. Isso vai depender de como os X estão espalhados. Tornar essas noções precisas faz parte do que você aprende em um curso sobre regressão; Eu não vou entrar aqui.