Dadas duas variáveis aleatórias e , podemos calcular seu "coeficiente de correlação" e formar a linha de melhor ajuste entre essas duas variáveis aleatórias. Minha pergunta é por que?
1) Existem variáveis aleatórias, e que são dependentes da pior maneira possível, ou seja, e apesar disso . Se pensarmos apenas na regressão linear, ficaríamos totalmente cegos para isso.
2) Por que linear especificamente? Existem outros tipos de relacionamentos que podem existir entre variáveis aleatórias. Por que escolher aquele dentre todos os outros?