Há um parágrafo sobre interações no The Book of Why (Pearl & Mackenzie, 2018), capítulo 9 (não consigo compartilhar o número da página porque tenho o livro no formato epub), onde os autores argumentam que:
No entanto, a Equação 9.4 se mantém automaticamente em uma situação, sem a necessidade aparente de invocar contrafactuais. É o caso de um modelo causal linear, do tipo que vimos no Capítulo 8. Como discutido lá, os modelos lineares não permitem interações , o que pode ser uma virtude e uma desvantagem. É uma virtude no sentido de facilitar a análise da mediação, mas é uma desvantagem se queremos descrever um processo causal do mundo real que envolve interações. [Ênfase minha]
A equação 9.4 é
Eles repetiram um argumento semelhante antes no capítulo 8:
Por outro lado, os modelos lineares não podem representar curvas dose-resposta que não sejam retas. Eles não podem representar efeitos limiares, como um medicamento que tem efeitos crescentes até uma certa dose e, em seguida, nenhum efeito adicional. Eles também não podem representar interações entre variáveis . Por exemplo, um modelo linear não pode descrever uma situação em que uma variável aprimora ou inibe o efeito de outra variável. (Por exemplo, a educação pode aumentar o efeito da experiência, colocando o indivíduo em um trabalho mais rápido, com aumentos anuais maiores.) [Ênfase minha]
E no capítulo 7:
Lembre-se também de que o ajuste baseado em regressão * funciona apenas para modelos lineares, que envolvem uma suposição importante de modelagem. Com modelos lineares, perdemos a capacidade de modelar interações não lineares, como quando o efeito de X em Y depende do nível de Z. O ajuste da porta traseira, por outro lado, ainda funciona bem, mesmo quando não temos idéia do que funções estão atrás das setas nos diagramas. Mas neste caso não paramétrico, precisamos empregar outros métodos de extrapolação para lidar com a maldição da dimensionalidade. [Ênfase minha]
Por que Pearl e Mackenzie argumentam que os modelos lineares não permitem interações? Eu negligencio um detalhe importante e informações específicas do contexto?
* Por ajuste baseado em regressão, os autores se referem (nos parágrafos anteriores), ao que chamamos de "controle de" outras variáveis: "O análogo de uma linha de regressão é um plano de regressão, que possui uma equação que se parece com ... O coeficiente nos fornece o coeficiente de regressão de em já ajustado para (É chamado de coeficiente de regressão parcial e está escrito .) "