Vou apenas adicionar alguns comentários adicionais sobre causalidade, vistos de uma perspectiva epidemiológica . A maioria desses argumentos é retirada de Practical Psychiatric Epidemiology , de Prince et al. (2003).
Causação, ou interpretação de causalidade , são de longe os aspectos mais difíceis da pesquisa epidemiológica. Estudos de coorte e transversal podem levar a efeitos de confusão, por exemplo. Citando S. Menard ( Longitudinal Research , Sage University Paper 76, 1991), HB Asher in Causal Modeling (Sage, 1976) propôs inicialmente o seguinte conjunto de critérios a serem cumpridos:
- Os fenômenos ou variáveis em questão devem cobrir, como indicado, por exemplo, por diferenças entre os grupos experimental e controle ou por correlação diferente de zero entre as duas variáveis.
- O relacionamento não deve ser atribuível a nenhuma outra variável ou conjunto de variáveis, ou seja, não deve ser falso, mas deve persistir mesmo quando outras variáveis são controladas, como indicado, por exemplo, pela randomização bem-sucedida em um projeto experimental (nenhuma diferença entre experimental e grupos controle antes do tratamento) ou por uma correlação parcial diferente de zero entre duas variáveis com outra variável mantida constante.
- A suposta causa deve preceder ou ser simultânea com o suposto efeito no tempo, conforme indicado pela mudança na causa que ocorre o mais tardar na mudança associada no efeito.
Embora os dois primeiros critérios possam ser facilmente verificados usando um estudo transversal ou ordenado por tempo, o último só pode ser avaliado com dados longitudinais, exceto pelas características biológicas ou genéticas cuja ordem temporal pode ser assumida sem dados longitudinais. Obviamente, a situação se torna mais complexa no caso de um relacionamento causal não recursivo.
Também gosto da ilustração a seguir (capítulo 13, na referência mencionada), que resume a abordagem promulgada por Hill (1965), que inclui 9 critérios diferentes relacionados ao efeito causal, como também citado por @ James. O artigo original era de fato intitulado "O meio ambiente e a doença: associação ou causa?" ( Versão em PDF ).
Finalmente, o capítulo 2 do livro mais famoso de Rothman, Modern Epidemiology (1998, Lippincott Williams & Wilkins, 2nd Edition), oferece uma discussão muito completa sobre causalidade e inferência causal, tanto de uma perspectiva estatística quanto filosófica.
Eu gostaria de adicionar as seguintes referências (tiradas aproximadamente de um curso on-line em epidemiologia) também são muito interessantes:
- Swaen, G e van Amelsvoort, L (2009). Uma abordagem de peso de evidência à inferência causal . Journal of Clinical Epidemiology , 62 , 270-277.
- Botti, C, Comba, P, Forastiere, F e Settimi, L (1996). Inferência causal em epidemiologia ambiental. o papel dos valores implícitos . A Ciência do Ambiente Total , 184 , 97-101.
- Weed, DL (2002). Epidemiologia ambiental. Noções básicas e efeito de prova de causa . Toxicology , 181-182 , 399-403.
- Franco, EL, Correa, P, Santella, RM, Wu, X, Goodman, SN e Petersen, GM (2004). Papel e limitações da epidemiologia no estabelecimento de uma associação causal . Seminários em Cancer Biology , 14 , 413-426.
Finalmente, esta revisão oferece uma perspectiva mais ampla sobre modelagem causal, inferência causal em estatística: Uma visão geral (J Pearl, SS 2009 (3)).