Uma explicação estatística-geométrica.
Imagine que você faça um gráfico de dispersão "de dentro para fora", onde os sujeitos são os eixos e as variáveis e são os pontos . Isso é chamado de gráfico de espaço do sujeito (em oposição ao gráfico de espaço variável usual ). Como há apenas 2 pontos a serem plotados, todas as dimensões nesse espaço, exceto apenas duas dimensões arbitrárias capazes de suportar os 2 pontos mais a origem, são redundantes e podem ser eliminadas com segurança. E assim ficamos com um avião. Desenhamos setas vetoriais da origem aos pontos: estas são nossas variáveis e como vetores no espaço sujeito dos dados.n 2 XYXY
Agora, se as variáveis foram centralizadas , em um espaço sujeito, o cosseno do ângulo entre seus vetores é seu coeficiente de correlação . Na foto abaixo, os vetores e são ortogonais: seus . A falta de correlação foi um pré-requisito descrito por @Dilip em sua resposta.Y r = 0XYr=0
Também para variáveis centralizadas, seus comprimentos de vetor em um espaço de assunto são seus desvios padrão . Na foto, e têm o mesmo comprimento, - variações iguais também foram um pré-requisito feito pelo @Dilip.YXY
Para desenhar a variável ou a variável usamos apenas a adição ou subtração de vetores que esquecemos desde a escola (mova o vetor Y para o final do vetor X e inverta a direção no caso de subtração - isso é mostrado por setas cinza na foto, - desenhe um vetor para onde a seta cinza aponta).X + YX−YX+Y
Fica muito claro que o comprimento dos vetores ou (o desvio padrão dessas variáveis) é, pelo teorema de Pitágoras, , e o ângulo entre e ou é 45 graus, qual cosseno - a correlação - éX + Y √X−YX+Y XX-YX+Y0,707 ...2σ2−−−√XX−YX+Y0.707...