A inferência é baseada em um modelo completo e, em caso afirmativo, em que circunstâncias?
Suponha que você esteja interessado no relacionamento potencial entre uma variável de resposta e várias variáveis preditoras de candidatos e use alguma forma de regressão (por exemplo, modelo linear generalizado) para responder a isso. Uma abordagem para inferir quais preditores são "importantes" ou têm um relacionamento aparentemente genuíno com a resposta seria a comparação de modelos com base no critério da teoria da informação (digamos, AIC). Embora as variáveis que não são retidas no modelo final possam ter algum relacionamento com a resposta, elas essencialmente não fornecem informações substanciais adicionais, dados outros preditores retidos no modelo.
Existe um caso em que seria mais apropriado simplesmente ajustar um modelo completo (global) (com todos os preditores candidatos), parar por aí e basear inferências em preditores individuais apenas nas estatísticas t (ou outras estatísticas) e valores p neste modelo completo, sem mais seleção de modelo?
Encontrei sugestões (por exemplo, Whittingham et al. "Por que ainda usamos modelagem gradual em ecologia e comportamento?" (2006) de que isso pode ser uma coisa sensata a ser feita, embora com possíveis desvantagens. Os autores dizem que os parâmetros estimados são imparciais, mas outras fontes dizem que essas estimativas e valores de p não são confiáveis, pois outras variáveis ("não importantes") do modelo podem afetá-las.
Se o objetivo é entender as possíveis relações biológicas, qual método seria mais apropriado?