A idéia básica aqui é que a covariância mede apenas um tipo particular de dependência ; portanto, os dois não são equivalentes. Especificamente,
A covariância é uma medida da linearidade entre duas variáveis. Se duas variáveis não forem linearmente relacionadas, isso não será refletido na covariância. Uma descrição mais detalhada pode ser encontrada aqui .
A dependência entre variáveis aleatórias refere-se a qualquer tipo de relacionamento entre os dois que os faça agir diferentemente "juntos" do que "sozinhos". Especificamente, a dependência entre variáveis aleatórias implica qualquer relação entre as duas que faz com que sua distribuição conjunta não seja o produto de suas distribuições marginais. Isso inclui relacionamentos lineares e muitos outros.
Se duas variáveis são não linearmente relacionadas, elas podem potencialmente ter 0 covariância, mas ainda são dependentes - muitos exemplos são dados aqui e este gráfico abaixo da wikipedia fornece alguns exemplos gráficos na linha inferior:
Um exemplo em que covariância zero e independência entre variáveis aleatórias são condições equivalentes é quando as variáveis são normalmente distribuídas em conjunto (ou seja, as duas variáveis seguem uma distribuição normal bivariada , que não é equivalente às duas variáveis sendo normalmente distribuídas individualmente). Outro caso especial é que os pares de variáveis bernoulli não são correlacionados se e somente se forem independentes (obrigado @ cardinal). Mas, em geral, os dois não podem ser considerados equivalentes.
Portanto, não se pode concluir, em geral, que duas variáveis são independentes apenas porque parecem não correlacionadas (por exemplo, não deixaram de rejeitar a hipótese nula de não correlação). É aconselhável plotar dados para inferir se os dois estão relacionados, não apenas parando em um teste de correlação. Por exemplo, (obrigado @gung), se alguém executar uma regressão linear (por exemplo, testar uma correlação diferente de zero) e encontrar um resultado não significativo, poderá ficar tentado a concluir que as variáveis não estão relacionadas, mas você ' investigamos apenas uma relação linear .
Eu não sei muito sobre psicologia, mas faz sentido que possa haver relações não lineares entre variáveis lá. Como um exemplo de brinquedo, parece possível que a capacidade cognitiva não esteja linearmente relacionada à idade - pessoas muito jovens e muito velhas não são tão afiadas quanto uma pessoa de 30 anos. Se alguém traçar alguma medida da capacidade cognitiva versus idade, pode-se esperar que a capacidade cognitiva seja mais alta em uma idade moderada e decaia em torno disso, o que seria um padrão não linear.