Intuição por trás das correlações 'parcial' e 'marginal' dos nomes

12

Alguém tem uma idéia sobre por que a correlação condicional entre duas variáveis é chamada correlação "parcial" e a correlação simples entre elas (portanto, quando não está condicionada a nenhuma outra variável) é chamada correlação "marginal"? Qual é a intuição por trás das palavras "parcial" e "marginal"? O que eles fazem com "partes" ou "margens"?

Seria bom aprender a resposta para entender melhor esses conceitos.

— user35159
fonte

Veja também: stats.stackexchange.com/questions/56969/…

— kjetil b halvorsen

11

O termo "marginal" é muito antigo. Se você voltar bastante na história, não havia revistas científicas (evidentemente elas começaram por volta de 1665 ). Em vez disso, os resultados intermediários foram comunicados por meio de cartas manuscritas e os resultados finais, escritos em livros. Antes, não havia muito a ver com os gráficos de dados antes da Playfair , mas os livros costumam ter tabelas com números em diferentes condições. Considere esta tabela:

\begin{matrix} UMA & B & C & D \\ Eu & x_{Eu, UMA} & x_{Eu, B} & x_{Eu, C} & x_{Eu, D} \\ Eu Eu & x_{Eu Eu, UMA} & x_{Eu Eu, B} & x_{Eu Eu, C} & x_{Eu Eu, D} \\ Eu Eu Eu & x_{Eu Eu Eu, UMA} & x_{Eu Eu Eu, B} & x_{Eu Eu Eu, C} & x_{Eu Eu Eu, D} \\ Eu V & x_{Eu V, UMA} & x_{Eu V, B} & x_{Eu V, C} & x_{Eu V, D} \end{matrix}

$\begin{array} \ &A &B &C &D \\ I &x_{I,A} &x_{I,B} &x_{I,C} &x_{I,D} \\ II &x_{II,A} &x_{II,B} &x_{II,C} &x_{II,D} \\ III &x_{III,A} &x_{III,B} &x_{III,C} &x_{III,D} \\ IV &x_{IV,A} &x_{IV,B} &x_{IV,C} &x_{IV,D} \\ \end{array}$ ; isto é, eles fornecem um número para uma combinação específica de condições. No entanto, às vezes os leitores queriam saber como era uma condição específica, sem levar em consideração a outra variável. Imagine- é o número de vezes que alguma coisa aconteceu quando a primeira variável foi e a segunda variável foi . Então, alguém pode querer saber, com que frequência isso aconteceu quando a primeira variável foi não importa qual fosse a segunda variável? É fácil descobrir isso, você apenas resume

x_{I, A}

$x_{I,A}$

I

$I$

A

$A$

I

$I$

x

$x$ s na primeira linha e ignore as colunas. As pessoas costumavam fazer esse tipo de coisa com frequência, e (naturalmente) escreviam os números nas margens do livro ao lado da mesa. Enquanto os números originais são condicionais, não havia nome para esses outros tipos de números; eles ficaram conhecidos como " marginais ".

O que esses números têm a ver com correlações? Bem, não é uma conexão direta, mas uma vez que você tenha a ideia de 'não levar em consideração outras variáveis' e tenha um nome para isso ("marginal"), quando surgir um novo contexto que seja análogo (ou seja, correlações) , o nome e a ideia são simplesmente aplicados.

Não conheço a etimologia das correlações parciais, mas posso lhe dar a intuição. Na verdade, é bastante direto: você está lidando com a correlação entre parte de uma variável e parte de outra. Considere esta figura:

insira a descrição da imagem aqui

Podemos imaginar o círculo esquerda é uma variável , o círculo direito é uma variável , e o círculo de cima é uma variável . A correlação entre duas variáveis está relacionada ao quanto os círculos se sobrepõem (de fato, podemos imaginar que a área dos círculos representa a variabilidade de cada variável e que a porcentagem da área é ). Agora, é claro que há alguma correlação entre e , mas também há alguma correlação entre e , e entre e . E se você quisesse saber qual era a correlação entre essas partes do $X$ $Y$ $Z$ $r^2$ $X$ $Y$ $X$ $Z$ $Y$ $Z$ $X$ e que não estavam relacionados a $Y$ $Z$ ? Essa seria a correlação parcial . Está relacionado à sobreposição entre as duas partes dos círculos que não incluem as lascas superiores que se cruzam com o círculo superior.

Gosto desta página da Web por fornecer uma discussão fácil de entender sobre correlações parciais e tópicos relacionados. Somente a primeira seção trata de correlações parciais em si, mas eu recomendo a leitura da página inteira (mesmo que seja bastante longa). Embora não esteja diretamente relacionada, a discussão neste tópico: Onde está a variação compartilhada entre todos os IVs em uma equação de regressão linear múltipla? , pode ser útil também.

— Repor a Monica
fonte

1

ρ (X, Y) = ρ (Y, X)

$\rho(X,Y) = \rho(Y,X)$

ρ_{X Y | Z} = ρ_{Y X | Z}

$\rho_{XY|Z} = \rho_{YX|Z}$

ρ_{Y X | Z} = \sqrt{\frac{A r e a (1)}{A r e a (X - (2 + c e n t e r))}}

$\rho_{YX|Z} = \sqrt{ \frac{Area(1)}{Area(X - (2+center))} }$

ρ_{X Y | Z}

$\rho_{XY|Z}$

ρ Y X | Z

$\rho{YX|Z}$

X

$X$

Y

$Y$

X

$X$

Y

$Y$

1

Provavelmente essa deve ser uma nova pergunta, @KiranK. É uma boa pergunta e não a queremos enterrada em comentários onde as pessoas nunca a encontrarão.

— gung - Restabelece Monica

Boa idéia, eu repostei como uma pergunta aqui: stats.stackexchange.com/questions/195410/… #

— Kiran K.

0

$\rho_{XY}$ $X,Y$

$\rho_{XY \cdot Z}$ $X,Y$ $Z$

ρ_{X Y \cdot Z} : = \frac{ρ_{X Y} - ρ_{X Z} ρ_{Y Z}}{\sqrt{1 - ρ_{X Z}^{2}} \sqrt{1 - ρ_{Y Z}^{2}}}

$\rho_{XY \cdot Z} := \frac{\rho_{XY}-\rho_{XZ}\rho_{YZ}}{\sqrt{1-\rho_{XZ}^2}\sqrt{1-\rho_{YZ}^2}}$

Para ilustrar as propriedades provenientes dessa definição, podemos considerar dois casos limite:

$X$ $Y$ $Z$
$ρ_{X Y \cdot Z} = ρ_{X Y}$ $\rho_{XY \cdot Z} = \rho_{XY}$
$Y$ $Z$ $\rho_{XY}$

ρ_{X Y \cdot Z} = 0 0

$\rho_{XY \cdot Z} = 0$

— Sebapi
fonte