Em primeiro lugar, entendo que as discussões sobre geralmente provocam explicações sobre (isto é, o coeficiente de determinação em regressão). O problema que estou procurando responder é generalizar isso para todas as instâncias de correlação entre duas variáveis.R 2
Então, fiquei intrigado com a variação compartilhada por um bom tempo. Recebi algumas explicações, mas todas parecem problemáticas:
É apenas mais um termo para covariância. Não pode ser esse o caso, pois a literatura de análise fatorial diferencia entre PCA e EFA, afirmando que o último é responsável pela variação compartilhada e o primeiro (o PCA obviamente é responsável pela covariância, pois está operando sobre uma matriz de covariância, portanto, compartilhada variação deve ser um conceito distinto).
É o coeficiente de correlação ao quadrado ( ). Vejo:
Isso faz um pouco mais de sentido. O problema aqui é interpretar como isso implica em uma variação compartilhada. Por exemplo, uma interpretação de 'compartilhamento de variação' é . não se reduz a isso, ou mesmo um conceito prontamente intuitivo [ {\ rm cov} (A, B) ^ 2 / ({\ rm var} (A) \ vezes {\ rm var} (B)) ; que é um objeto tridimensional].r 2 c o v ( A , B ) 2 / ( v um r ( A ) × v um r ( B ) )
Os links acima tentam explicá-lo através de um diagrama de Ballentine. Eles não ajudam. Em primeiro lugar, os círculos têm o mesmo tamanho (o que parece ser importante para a ilustração por algum motivo), o que não leva em consideração variações desiguais. Pode-se supor que são os diagramas de Ballentine para as variáveis padronizadas, portanto, variância igual; nesse caso, o segmento sobreposto seria responsável pela covariância entre duas variáveis padronizadas (a correlação). Então , não .r 2
TL; DR: explicações sobre variação compartilhada dizem o seguinte:
Ao quadrar o coeficiente, você sabe quanta variação, em termos percentuais, as duas variáveis compartilham.
Por que seria esse o caso?