O termo "marginal" é muito antigo. Se você voltar bastante na história, não havia revistas científicas (evidentemente elas começaram por volta de 1665 ). Em vez disso, os resultados intermediários foram comunicados por meio de cartas manuscritas e os resultados finais, escritos em livros. Antes, não havia muito a ver com os gráficos de dados antes da Playfair , mas os livros costumam ter tabelas com números em diferentes condições. Considere esta tabela:
EuEuEuEuEuEuEuVUMAxEu, AxEuEu, AxEuEuEu, AxEuV, ABxEu, BxEuEu, BxEuEuEu, BxEuV, BCxEu, CxEuEu, CxEuEuEu, CxEuV, CDxEu, DxEuEu, DxEuEuEu, DxEuV, D
; isto é, eles fornecem um número para uma combinação específica de condições. No entanto, às vezes os leitores queriam saber como era uma condição específica, sem levar em consideração a outra variável. Imagine- é o número de vezes que alguma coisa aconteceu quando a primeira variável foi e a segunda variável foi . Então, alguém pode querer saber, com que frequência isso aconteceu quando a primeira variável foi não importa qual fosse a segunda variável? É fácil descobrir isso, você apenas resume
xEu, AEuUMAEuxs na primeira linha e ignore as colunas. As pessoas costumavam fazer esse tipo de coisa com frequência, e (naturalmente) escreviam os números nas margens do livro ao lado da mesa. Enquanto os números originais são condicionais, não havia nome para esses outros tipos de números; eles ficaram conhecidos como "
marginais ".
O que esses números têm a ver com correlações? Bem, não é uma conexão direta, mas uma vez que você tenha a ideia de 'não levar em consideração outras variáveis' e tenha um nome para isso ("marginal"), quando surgir um novo contexto que seja análogo (ou seja, correlações) , o nome e a ideia são simplesmente aplicados.
Não conheço a etimologia das correlações parciais, mas posso lhe dar a intuição. Na verdade, é bastante direto: você está lidando com a correlação entre parte de uma variável e parte de outra. Considere esta figura:
Podemos imaginar o círculo esquerda é uma variável , o círculo direito é uma variável , e o círculo de cima é uma variável . A correlação entre duas variáveis está relacionada ao quanto os círculos se sobrepõem (de fato, podemos imaginar que a área dos círculos representa a variabilidade de cada variável e que a porcentagem da área é ). Agora, é claro que há alguma correlação entre e , mas também há alguma correlação entre e , e entre e . E se você quisesse saber qual era a correlação entre essas partes doXYZr2XYXZYZXe que não estavam relacionados aYZ ? Essa seria a correlação parcial . Está relacionado à sobreposição entre as duas partes dos círculos que não incluem as lascas superiores que se cruzam com o círculo superior.
Gosto desta página da Web por fornecer uma discussão fácil de entender sobre correlações parciais e tópicos relacionados. Somente a primeira seção trata de correlações parciais em si, mas eu recomendo a leitura da página inteira (mesmo que seja bastante longa). Embora não esteja diretamente relacionada, a discussão neste tópico: Onde está a variação compartilhada entre todos os IVs em uma equação de regressão linear múltipla? , pode ser útil também.