Essa é uma pergunta bastante geral (ou seja, não necessariamente específica para estatística), mas notei uma tendência no aprendizado de máquina e na literatura estatística em que os autores preferem seguir a seguinte abordagem:
Abordagem 1 : Obter uma solução para um problema prático, formulando uma função de custo para a qual é possível (por exemplo, do ponto de vista computacional) encontrar uma solução globalmente ótima (por exemplo, formulando uma função de custo convexa).
ao invés de:
Abordagem 2 : obtenha uma solução para o mesmo problema formulando uma função de custo para a qual talvez não consigamos obter uma solução ótima globalmente (por exemplo, só podemos obter uma solução ótima localmente).
Observe que falando rigorosamente os dois problemas são diferentes; o pressuposto é que podemos encontrar a solução ideal globalmente para a primeira, mas não para a segunda.
Outras considerações à parte (ou seja, velocidade, facilidade de implementação, etc.), estou procurando:
- Uma explicação para esta tendência (por exemplo, argumentos matemáticos ou históricos)
- Benefícios (práticos e / ou teóricos) para seguir a Abordagem 1 em vez de 2 na resolução de um problema prático.