Esta minha resposta não responde a pergunta corretamente. Por favor, leia os comentários.
Vamos comparar a covariância usual e a covariância à distância . A parte efetiva de ambos são seus numeradores. (Os denominadores estão simplesmente na média.) O numerador de covariância é o produto cruzado somado (= produto escalar) dos desvios de um ponto, a média: ( com sobrescrito como o centróide). Para reescrever a expressão neste estilo: , com representando o desvio do ponto do centróide, ou seja, sua distância (assinada) para o centróide. A covariância é definida pela soma dos produtos das duas distâncias em todos os pontos.Σ(xi−μx)(yi−μy)μΣdxiμdyiμdi
Como estão as coisas com a covariância à distância ? O numerador é, como você sabe, . Não é muito parecido com o que escrevemos acima? e qual é a diferença? Aqui, a distância está entre pontos de dados variáveis , não entre um ponto de dados e a média como acima. A covariância da distância é definida pela soma dos produtos das duas distâncias sobre todos os pares de pontos.Σdxijdyijd
O produto escalar (entre duas entidades - no nosso caso, variáveis e ) com base na co-distância de um ponto fixo é maximizado quando os dados são organizados em uma linha reta . O produto escalar com base na co-distância de um ponto variável * é maximizado quando os dados são organizados localmente em uma linha reta, por partes; em outras palavras, quando os dados em geral representam uma cadeia de qualquer forma , dependência de qualquer forma.xy
E, de fato, a covariância usual é maior quando o relacionamento está mais próximo de ser linear perfeito e as variações são maiores. Se você padronizar as variações para uma unidade fixa, a covariância depende apenas da força da associação linear e é denominada correlação de Pearson . E, como sabemos - e acabamos de entender por que - a covariância à distância é maior quando o relacionamento está mais próximo da curva perfeita e os spreads de dados são maiores. Se você padronizar os spreads para uma unidade fixa, a covariância depende apenas da força de alguma associação curvilínea e é denominada correlação browniana (distância) .