Como no AdamO, acho que a chave para responder a essa pergunta é a noção de inferência causal e como chegar "em direção" a um modelo causal usando configurações observacionais.
Em um mundo perfeito, teríamos algo chamado população contrafactual - a população do estudo, idêntica em todos os aspectos, exceto a única coisa em que estamos interessados. A diferença entre essas duas populações, com base nessa diferença, é um verdadeiro resultado causal.
Obviamente, não podemos ter isso.
Existem maneiras, no entanto, de tentar chegar perto disso:
Randomização: teoricamente (se a randomização for feita corretamente), você deverá fornecer duas populações idênticas, exceto o tratamento após a randomização.
Estratificação: você pode observar uma população dentro dos níveis de covariáveis, onde você está fazendo comparações "iguais com iguais". Isso funciona esplendidamente para um pequeno número de níveis, mas rapidamente se torna complicado.
Correspondência: Correspondência é uma tentativa de reunir uma população de estudo de modo que o Grupo A se assemelhe ao Grupo B e, portanto, seja passível de comparação.
Ajuste estatístico: a inclusão de covariáveis em um modelo de regressão permite estimar um efeito dentro dos níveis das covariáveis - novamente, comparando igual com igual, ou pelo menos tentando fazê-lo.
Todos são uma tentativa de se aproximar dessa população contrafactual. A melhor forma de obter isso depende do que você deseja divulgar e da aparência do seu estudo.