Wikipedia diz
Métodos que se baseiam em um teste abrangente antes de proceder a múltiplas comparações . Normalmente, esses métodos requerem um teste de intervalo ANOVA / Tukey significativo antes de prosseguir para múltiplas comparações. Esses métodos têm controle "fraco" do erro do tipo I.
O teste F na ANOVA é um exemplo de teste omnibus, que testa a significância geral do modelo. O teste F significativo significa que, entre as médias testadas, pelo menos duas das médias são significativamente diferentes, mas esse resultado não especifica exatamente quais são as médias diferentes umas das outras. Na verdade, as diferenças dos meios de teste foram feitas pela estatística racional quadrática F (F = MSB / MSW). Para determinar qual média difere de outra média ou qual contraste de médias é significativamente diferente, os testes Post Hoc (testes de comparação múltipla) ou planejados devem ser realizados após a obtenção de um teste F omnibus significativo. Pode-se considerar o uso da correção simples de Bonferroni ou outra correção adequada.
Portanto, um teste abrangente é usado para testar a significância geral, enquanto a comparação múltipla é descobrir quais diferenças são significativas.
Mas se eu entendi corretamente, o principal objetivo da comparação múltipla é testar a significância geral e também descobrir quais diferenças são significativas. Em outras palavras, a comparação múltipla pode fazer o que um onibus pode fazer. Então, por que precisamos de um teste de ônibus?