Começarei com a segunda parte da sua pergunta, que diz respeito à diferença entre estudos de controle randomizados e estudos observacionais, e a encerrarei com a parte da sua pergunta referente ao "modelo verdadeiro" vs. "modelo causal estrutural".
Usarei um dos exemplos de Pearl, que é fácil de entender. Você percebe que quando as vendas de sorvete são mais altas (no verão), a taxa de criminalidade é mais alta (no verão) e quando as vendas de sorvete são mais baixas (no inverno), a taxa de criminalidade é mais baixa. Isso faz você pensar se o nível de vendas de sorvetes está causando o nível de criminalidade.
Se você pudesse realizar um experimento de controle aleatório, levaria muitos dias, suponha 100 dias, e em cada um desses dias atribuiria aleatoriamente o nível de vendas de sorvete. A chave para essa randomização, dada a estrutura causal mostrada no gráfico abaixo, é que a atribuição do nível de vendas de sorvetes é independente do nível de temperatura. Se tal experimento hipotético puder ser realizado, você deve descobrir que, nos dias em que as vendas foram aleatoriamente designadas como altas, a taxa média de criminalidade não é estatisticamente diferente dos dias em que as vendas foram designadas como baixas. Se você tivesse as mãos em tais dados, estaria tudo pronto. A maioria de nós, no entanto, precisa trabalhar com dados observacionais, onde a randomização não fez a mágica que fez no exemplo acima. Crucialmente, em dados observacionais, não sabemos se o nível de vendas de sorvetes foi determinado independentemente da temperatura ou se depende da temperatura. Como resultado, teríamos que, de alguma forma, desembaraçar o efeito causal do meramente correlativo.
A afirmação de Pearl é que as estatísticas não têm uma maneira de representar E [Y | Definimos X para ser igual a um valor específico], em oposição a E [Y | Condicionamento nos valores de X, dado pela distribuição conjunta de X e Y ] É por isso que ele usa a notação E [Y | do (X = x)] para se referir à expectativa de Y, quando intervimos em X e definimos seu valor igual a x, em oposição a E [Y | X = x] , que se refere ao condicionamento do valor de X, e considerando-o como dado.
O que exatamente significa intervir na variável X ou definir X igual a um valor específico? E como é diferente de condicionar o valor de X?
A intervenção é melhor explicada com o gráfico abaixo, no qual a temperatura tem um efeito causal nas vendas de sorvetes e na taxa de criminalidade, e as vendas de sorvetes têm um efeito causal na taxa de criminalidade, e as variáveis U representam fatores não medidos que afetam as variáveis, mas não queremos modelar esses fatores. Nosso interesse está no efeito causal das vendas de sorvetes na taxa de criminalidade e suponha que nossa representação causal seja precisa e completa. Veja o gráfico abaixo.
Agora, suponha que possamos definir um nível de vendas de sorvete muito alto e observar se isso se traduziria em taxas mais altas de criminalidade. Para fazer isso, interviríamos nas vendas de sorvetes, o que significa que não permitimos que as vendas de sorvetes respondam naturalmente à temperatura. De fato, isso significa que realizamos o que Pearl chama de "cirurgia" no gráfico, removendo todas as bordas direcionadas para ela. variável. No nosso caso, como estamos intervindo nas vendas de sorvetes, removeríamos a borda das vendas de Temperatura e Sorvete, conforme mostrado abaixo. Definimos o nível de vendas de sorvetes para o que queremos, em vez de permitir que seja determinado pela temperatura. Então imagine que realizamos dois desses experimentos, aquele em que intervimos e definimos o nível de vendas de sorvetes muito alto e aquele em que intervimos e definimos o nível de vendas de sorvetes muito baixo e depois observamos como a taxa de criminalidade responde em cada caso. Em seguida, começaremos a entender se há um efeito causal entre as vendas de sorvetes e a taxa de criminalidade ou não.
Pearl distinguiu entre intervenção e condicionamento. O condicionamento aqui se refere apenas a uma filtragem de um conjunto de dados. Pense em condicionar a temperatura como olhando em nosso conjunto de dados observacionais apenas nos casos em que a temperatura fosse a mesma. O condicionamento nem sempre nos dá o efeito causal que estamos procurando (nem sempre o efeito causal). Acontece que o condicionamento nos daria o efeito causal na figura simplista desenhada acima, mas podemos facilmente modificar o gráfico para ilustrar um exemplo em que o condicionamento na temperatura não nos daria o efeito causal, enquanto a intervenção nas vendas de sorvetes daria. Imagine que existe outra variável que causa vendas de sorvetes, chame-a de variável X. No gráfico, seria representado com uma seta em Vendas de sorvetes. Nesse caso, condicionar a temperatura não nos daria o efeito causal das vendas de sorvetes na taxa de criminalidade, porque deixaria intocado o caminho: Variável X -> venda de sorvetes -> taxa de criminalidade. Por outro lado, intervir nas vendas de sorvetes significaria, por definição, remover todas as flechas do sorvete, e isso nos daria o efeito causal das vendas de sorvetes na taxa de criminalidade.
Mencionarei apenas que as maiores contribuições de Pearl, na minha opinião, são o conceito de colisores e como o condicionamento dos colisores fará com que variáveis independentes sejam provavelmente dependentes.
Pearl chamaria um modelo com coeficientes causais (efeito direto), dado por E [Y | do (X = x)], o modelo causal estrutural. E as regressões em que os coeficientes são dados por E [Y | X] é o que ele diz que os autores chamam erroneamente de "modelo verdadeiro", ou seja, quando procuram estimar o efeito causal de X em Y e não apenas prever Y .
Então, qual é a ligação entre os modelos estruturais e o que podemos fazer empiricamente? Suponha que você queira entender o efeito causal da variável A na variável B. Pearl sugere duas maneiras de fazê-lo: Critério de backdoor e critério de Front door. Vou expandir o primeiro.
Critério de backdoor: primeiro, você precisa mapear corretamente todas as causas de cada variável e, usando o critério Backdoor, identificar o conjunto de variáveis nas quais você precisa condicionar (e também o conjunto de variáveis que você precisa para garantir que você não condicione em - isto é, colisores) para isolar o efeito causal de A em B. Como Pearl aponta, isso é testável. Você pode testar se mapeou ou não corretamente o modelo causal. Na prática, isso é mais fácil dizer do que fazer e, na minha opinião, o maior desafio com o critério Backdoor da Pearl. Segundo, execute a regressão, como de costume. Agora você sabe em que condições. Os coeficientes que você obterá seriam os efeitos diretos, conforme mapeados em seu mapa causal.