Talvez isso seja útil para algumas pessoas que compartilham o mesmo entendimento intuitivo. Todos nós vimos algo assim:
r = 0,66
Como outros já apontaram, os valores da amostra estão correlacionados, mas isso não significa que a população tenha uma correlação diferente de zero.
É claro que esses dois deveriam ser independentes - dado que Nicolas Cage apareceu em um recorde de 10 filmes este ano, não devemos fechar a piscina local para o verão por questões de segurança.
Mas quando verificamos quantas pessoas se afogam este ano, há uma pequena chance de que um número recorde de 1000 pessoas se afogue este ano.
Obter essa correlação é improvável. Talvez um em mil. Mas é possível, mesmo que os dois sejam independentes. Mas este é apenas um caso. Considere que existem milhões de eventos possíveis para medir por aí, e você pode ver a chance de que as chances de dois acontecerem para dar uma alta correlação sejam bastante altas (daí a existência de gráficos como o acima).
Outra maneira de analisar é que garantir que dois eventos independentes sempre gerem valores não correlacionados é restritivo. Dados dois dados independentes e os resultados do primeiro, há um certo conjunto (considerável) de resultados para o segundo dado que fornecerá alguma correlação diferente de zero. Restringir os resultados do segundo dado para dar uma correlação zero com o primeiro é uma clara violação da independência, pois as jogadas do primeiro dado estão afetando a distribuição dos resultados.