Muitas pessoas têm excelentes respostas, aqui estão meus US $ 0,02.
Existem duas maneiras de analisar o "melhor modelo" ou "seleção de modelo", falando estatisticamente:
1 Uma explicação que é tão simples quanto possível, mas não mais simples (Attrib. Einstein)
- This is also called Occam's Razor, as explanation applies here.
- Have a concept of True model or a model which approximates the truth
- Explanation is like doing scientific research
2 Previsão é o interesse, semelhante ao desenvolvimento de engenharia.
- Prediction is the aim, and all that matters is that the model works
- Model choice should be based on quality of predictions
- Cf: Ein-Dor, P. & Feldmesser, J. (1987) Attributes of the performance of central processing units: a relative performance prediction model. Communications of the ACM 30, 308–317.
(Mis) concepção generalizada:
Model Choice é equivalente a escolher o melhor modelo
Para explicação, devemos estar atentos à possibilidade de haver vários (aproximadamente) igualmente bons modelos explicativos. A simplicidade ajuda tanto na comunicação dos conceitos incorporados no modelo quanto no que os psicólogos chamam de generalização, a capacidade de 'trabalhar' em cenários muito diferentes daqueles em que o modelo foi estudado. Portanto, há um prêmio em alguns modelos.
Para previsão: (boa parte do Dr. Ripley) é a escolha entre opiniões de especialistas: se você tem acesso a um grande painel de especialistas, como usaria as opiniões deles?
A validação cruzada cuida do aspecto da previsão. Para detalhes sobre o CV, consulte esta apresentação do Dr. BD Ripley Apresentação do Dr. Brian D. Ripley sobre seleção de modelos
Citação: Observe que tudo nesta resposta é da apresentação citada acima. Eu sou um grande fã desta apresentação e eu gosto. Outras opiniões podem variar. O título da apresentação é: "Seleção entre grandes classes de modelos" e foi dado no Simpósio em homenagem aos 80 anos de John Nelder, Imperial College, de 29 a 30 de março de 2004, pelo Dr. Brian D. Ripley.