Além da importante resposta de Carlos Cinelli a essa pergunta, existem mais algumas razões pelas quais os coeficientes de regressão podem não ser causais.
Em primeiro lugar, a especificação incorreta do modelo pode fazer com que os parâmetros não sejam causais. Só porque você tem todas as variáveis relevantes no seu modelo não significa que você as ajustou da maneira correta. Como um exemplo muito simples, considere uma variável X que é distribuída simétrica em torno de 0. Suponha que sua variável de resultado Y seja afetada por X forma que E(Y∣X)=X2 . Regressar Y em X (em oposição a X2 ) fornecerá um coeficiente estimado para X de cerca de 0, claramente tendencioso, apesar de você ter ajustado para todas (a única) variável que afetaY .
Em segundo lugar, e relacionado ao tópico causalidade reversa, também há o risco de que você possa ter um viés de seleção , ou seja, que sua amostra tenha sido selecionada de tal forma que não seja representativa para a população para a qual você deseja extrair sua inferência. Além disso, os dados ausentes também podem introduzir viés se os dados não estiverem faltando completamente aleatoriamente.