As respostas que você já obteve são excelentes, mas vou dar uma resposta (espero) complementar da perspectiva de um epidemiologista. Eu realmente tenho três pensamentos sobre isso:
Primeiro, eles não. Veja também: Todos os modelos estão errados, alguns modelos são úteis. O objetivo não é produzir um número único e definitivo, considerado a "verdade" de uma função subjacente. O objetivo é produzir uma estimativa dessa função, com uma quantificação da incerteza em torno dela, que é uma aproximação razoável e útil da função subjacente.
Isto é especialmente verdade para medidas de efeito grande. A mensagem "retirar" de um estudo que considera um risco relativo de 3,0 não é realmente diferente se o relacionamento "verdadeiro" for 2,5 ou 3,2. Como a @onestop mencionou, isso fica mais difícil com pequenas estimativas de medidas de efeito, porque a diferença entre 0,9, 1,0 e 1,1 pode ser enorme do ponto de vista de saúde e política.
Segundo, há um processo oculto na maioria dos trabalhos de Epidemiologia. Esse é o processo de seleção de modelo real . Tendemos a relatar o modelo com o qual acabamos, não todos os modelos que consideramos (porque isso seria cansativo, se nada mais). Existem várias etapas de construção de modelos, diagramas conceituais, diagnósticos, estatísticas de ajuste, análise de sensibilidade, xingamentos em computadores e rabiscos em quadros brancos envolvidos na análise de pequenos estudos observacionais.
Porque enquanto você está fazendo suposições, muitas delas também são suposições que você pode verificar.
Terceiro, às vezes não. E então vamos a conferências e discutimos sobre isso;)
Se você está interessado nos detalhes da Epidemiologia como um campo e em como realizamos pesquisas, o melhor lugar para começar é provavelmente a Modern Epidemiology 3rd Edition de Rothman, Greenland and Lash. É uma visão geral moderadamente técnica e muito boa de como a pesquisa Epi é conduzida.