Não há contradição entre o mundo factual e a ação de interesse no nível intervencionista. Por exemplo, fumar até hoje e ser forçado a parar de fumar a partir de amanhã não está em contradição entre si, mesmo que você possa dizer que um "nega" o outro. Mas agora imagine o seguinte cenário. Você conhece Joe, um fumante vitalício que tem câncer de pulmão, e se pergunta: e se Joe não fumasse há trinta anos, ele estaria saudável hoje? Nesse caso, estamos lidando com a mesma pessoa, ao mesmo tempo, imaginando um cenário em que ação e resultado estão em contradição direta com fatos conhecidos.
Assim, a principal diferença de intervenções e contrafatuais é que, enquanto nas intervenções você está perguntando o que acontecerá em média se realizar uma ação, em contrafatuais você está perguntando o que teria acontecido se você tivesse tomado um curso de ação diferente em uma situação específica , desde que você tenha informações sobre o que realmente aconteceu. Observe que, como você já sabe o que aconteceu no mundo real, é necessário atualizar suas informações sobre o passado à luz das evidências que observou.
Esses dois tipos de consultas são matematicamente distintos porque exigem que níveis diferentes de informações sejam respondidos (contrafatuais precisam de mais informações para serem respondidas) e uma linguagem ainda mais elaborada para serem articuladas !.
Com as informações necessárias para responder às perguntas do Rung 3, você pode responder às perguntas do Rung 2, mas não o contrário. Mais precisamente, você não pode responder perguntas contra-factuais apenas com informações de intervenção. Exemplos em que ocorre o choque de intervenções e contrafactuais já foram dados aqui no CV, veja este post e este post . No entanto, por uma questão de exaustividade, incluirei um exemplo aqui também.
O exemplo abaixo pode ser encontrado na causalidade, seção 1.4.4.
x=1x=0y=0y=1P(y|x)=0.5 ∀x,y
P(Y=1|do(X=1))−P(Y=1|do(X=0)=0
P(Y0=0|X=1,Y=1)
Esta pergunta não pode ser respondida apenas com os dados de intervenção que você possui. A prova é simples: posso criar dois modelos causais diferentes que terão as mesmas distribuições intervencionistas, mas distribuições contrafactuais diferentes. Os dois são fornecidos abaixo:
UP(y,x)
Observe que, no primeiro modelo, ninguém é afetado pelo tratamento, portanto, a porcentagem de pacientes que morreram sob tratamento que teriam se recuperado se não tivessem feito o tratamento é zero.
No entanto, no segundo modelo, todo paciente é afetado pelo tratamento, e temos uma mistura de duas populações nas quais o efeito causal médio acaba sendo zero. Neste exemplo, a quantidade contrafactual agora é de 100% - no Modelo 2, todos os pacientes que morreram sob tratamento teriam se recuperado se não tivessem feito o tratamento.
Portanto, há uma clara distinção entre a linha 2 e a linha 3. Como o exemplo mostra, você não pode responder perguntas contrafactuais apenas com informações e suposições sobre intervenções. Isso fica claro com as três etapas para calcular um contrafactual:
- P(u)P( u | e )
- do ( x ) )
- Y
Não será possível calcular sem algumas informações funcionais sobre o modelo causal ou sem algumas informações sobre variáveis latentes.