Relações entre correlação e causalidade


19

Na página da Wikipedia intitulada correlação não implica causalidade ,

Para quaisquer dois eventos correlacionados, A e B, os diferentes relacionamentos possíveis incluem:

  1. A causa B (causa direta);
  2. B causa A (causa reversa);
  3. A e B são consequências de uma causa comum, mas não se causam;
  4. A e B causam C, que é (explícita ou implicitamente) condicionado;
  5. A causa B e B causa A (causa bidirecional ou cíclica);
  6. A causa C que causa B (causa indireta);
  7. Não há conexão entre A e B; a correlação é uma coincidência.

O que o quarto ponto significa. A e B causam C, que é (explícita ou implicitamente) condicionado. Se A e B causam C, por que A e B precisam ser correlacionados.



2
Apesar da dizendo que eu iria esperar que haja uma alta correlação entre correlação e causalidade ...
Mehrdad


Respostas:


18

"Condicionamento" é uma palavra da teoria das probabilidades: https://en.wikipedia.org/wiki/Conditional_probability

Condicionar em C significa que estamos apenas analisando casos em que C é verdadeiro. "Implicitamente" significa que talvez não estejamos explicitando essa restrição, às vezes nem estamos conscientes disso.

O argumento significa que, quando A e B causam C, observando uma correlação entre A e B nos casos em que C é verdadeiro, não significa que exista uma relação real entre A e B. É apenas condicionar C (talvez de má vontade) que cria uma correlação artificial.

Vamos dar um exemplo.

Em um país, existem exatamente dois tipos de doenças, perfeitamente independentes. Chamada A: "pessoa tem primeira doença", B: "pessoa tem segunda doença". Suponha que , .P ( B ) = 0,1P(A)=0.1P(B)=0.1

Agora, qualquer pessoa que tenha uma dessas doenças vai ao médico e só então. Ligue para C: "a pessoa vai ao médico". Nós temos .C=A or B

Agora vamos calcular algumas probabilidades:

  • P(C)=0.19
  • P(A|C)=P(B|C)=0.10.190.53
  • P(A and B|C)=0.010.190.053
  • P(A|C)P(B|C)0.28

Claramente, quando condicionados em C, e estão muito longe de serem independentes. Na verdade, condicionando a C, parece "causa" .B n o t Um BABnotAB

Se você usar a lista de pessoas que onde gravados pelo seu médico (s) como uma fonte de dados para uma análise, em seguida, parece haver uma forte correlação entre doenças e . Você pode não estar ciente do fato de que sua fonte de dados é realmente um condicionamento. Isso também é chamado de "viés de seleção".BAB


13

O quarto ponto é um exemplo do paradoxo de Berkson , também conhecido como condicionamento de um colisor , também conhecido como fenômeno de explicação .

Como exemplo, considere uma jovem que é frequentemente convidada a namorar homens jovens e ela deve decidir se aceita ou rejeita cada proposta de data. Os rapazes variam em quão atraentes e charmosos são, e vamos supor que esses dois traços sejam independentes na população de homens proponentes de encontros. Naturalmente, a jovem está mais inclinada a aceitar uma proposta de encontro, mais atraente ou charmoso o homem é. Portanto, um modelo causal para esta situação pode ser: Isso é, e ambos causam , que assume valores de 0 ou 1 se a mulher rejeitar ou aceitar a proposta de data, respectivamente.

AttractiveAcceptCharming
AttractiveCharmingAccept

Supomos acima que e são independentes na população de homens que propõem datas. Mas eles ainda são independentes se considerarmos apenas os homens cujas propostas a mulher aceitou? Em outras palavras, condicionamos em . Agora, suponha que eu lhe fale sobre um homem que a mulher concordou em namorar, e eu lhe digo que ele (na opinião da mulher) não é nada atraente. Bem, sabemos que a mulher concordou em sair com ele de qualquer maneira, para deduzirmos razoavelmente que ele deve ser bastante charmoso. Por outro lado, se aprendermos sobre um homem cuja proposta de data foi aceita e que não é encantadora, deduziríamos razoavelmente que ele deve ser bastante atraente.AttractiveCharmingAccept=1

Você vê o que aconteceu aqui? Ao condicionarmos em , induzimos uma correlação negativa entre e , mesmo que esses dois traços sejam (por suposição) marginalmente independentes. Do ponto de vista da mulher, os homens atraentes que ela namora tendem a ser menos encantadores, e os homens encantadores que ela namora tendem a ser menos atraentes. Mas isso ocorre porque, pensando apenas nos homens com quem ela namorou, ela está implicitamente condicionando o . Se ela considerasse todos os homens que propuseram datas, independentemente de aceitar a proposta, veria que não há associação estatística entre as duas características.Accept=1AttractiveCharmingAccept


5

Paradoxo de Simpson e paradoxo de Berkson pode cada exemplos dão de "A e B ambos causa C, o qual é (explicita ou implicitamente) condicionando a"

Como exemplo, suponha que eu tenha selos em minha coleção, dos quais são raros ( ) e são bonitos ( ). Se não houver uma relação intrínseca entre raridade e beleza, pode acontecer que dos meus selos sejam bonitos e raros.100010010%20020%20

Se agora exibir meus selos interessantes, ou seja, aqueles que são raros ou bonitos ou ambos, haverá uma aparente correlação negativa entre raridade e beleza ( dos selos raros exibidos são bonitos, enquanto dos selos comuns exibidos são bonitos. ) devido inteiramente ao condicionamento de ser interessante. 20 % 100 %28020%100%


Este é um exemplo do paradoxo de Berkson, não do paradoxo de Simpson (veja minha resposta).
Jake Westfall

@JakeWestfall Você provavelmente está certo - eu sabia que eu tinha escrito o exemplo selos antes de algum lugar, mas esqueceu de onde e que acaba por ser a página da Wikipedia para o paradoxo de Berkson
Henry

4

O parágrafo começa com "Para quaisquer dois eventos correlacionados, A e B, ...", então meu palpite é que a correlação é assumida no início. Em outras palavras, eles não precisam ser correlacionados para causar simultaneamente C, mas se eles foram correlacionados e ambos causaram C, isso não implica que exista uma relação causal entre eles.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.