Nos comentários, foram sugeridas 15 maneiras de entender o coeficiente de correlação:
As 13 maneiras discutidas no artigo de Rodgers e Nicewander (The American Statistician, fevereiro de 1988) são
Uma função de notas e meios brutos,
r=∑(Xi−X¯)(Yi−Y¯)∑(Xi−X¯)2(Yi−Y¯)2−−−−−−−−−−−−−−−−−−√.
Covariância Padronizada,
r=sXY/(sXsY)
onde é covariância de amostra es X e ssXYsX são desvios padrão da amostra.sY
Inclinação Padronizada da Linha de Regressão,
r=bY⋅XsXsY=bX⋅YsYsX,
onde e b X ⋅ Y são as inclinações das linhas de regressão.bY⋅XbX⋅Y
A média geométrica das duas inclinações de regressão,
r=±bY⋅XbX⋅Y−−−−−−−√.
A raiz quadrada da razão de duas variações (proporção de variabilidade contabilizada),
r=∑(Yi−Yi^)2∑(Yi−Y¯)2−−−−−−−−−−−−⎷=SSREGSSTOT−−−−−−√=sY^sY.
O produto cruzado médio de variáveis padronizadas,
r=∑zXzY/N.
Uma função do ângulo entre as duas linhas de regressão padronizada. As duas linhas de regressão (de vs. X e X vs. Y ) são simétricas em relação à diagonal. Seja o ângulo entre as duas linhas β . EntãoYXXYβ
r=sec(β)±tan(β).
Uma função do ângulo entre os dois vetores variáveis,
r=cos(α).
zY−zXXY
r=1−s2(zY−zX)/2=s2(zY+zX)/2−1.
Estimated from the "Balloon" Rule,
r≈1−(h/H)2−−−−−−−−−√
where H is the vertical range of the entire X−Y scatterplot and h is the range through the "center of the distribution on the X axis" (that is, through the point of means).
In Relation to the Bivariate Ellipses of Isoconcentration,
r=D2−d2D2+d2
where D and d are the major and minor axis lengths, respectively. r also equals the slope of the tangent line of an isocontour (in standardized coordinates) at the point the contour crosses the vertical axis.
A Function of Test Statistics from Designed Experiments,
r=tt2+n−2−−−−−−−−√
where t is the test statistic in a two-independent sample t test for a designed experiment with two treatment conditions (coded as X=0,1) and n is the combined total number of observations in the two treatment groups.
The Ratio of Two Means. Assume bivariate normality and standardize the variables. Select some arbitrarily large value Xc of X. Then
r=E(Y|X>Xc)E(X|X>Xc).