A maioria dos procedimentos de estimativa envolve encontrar parâmetros que minimizem (ou maximizem) alguma função objetiva. Por exemplo, com o OLS, minimizamos a soma dos resíduos ao quadrado. Com a Estimativa de máxima verossimilhança, maximizamos a função de verossimilhança. A diferença é trivial: a minimização pode ser convertida em maximização usando o negativo da função objetivo.
Às vezes, esse problema pode ser resolvido algebricamente, produzindo uma solução de forma fechada. Com o OLS, você resolve o sistema de condições de primeira ordem e obtém a fórmula familiar (embora você provavelmente ainda precise de um computador para avaliar a resposta). Em outros casos, isso não é matematicamente possível e você precisa procurar valores de parâmetros usando um computador. Nesse caso, o computador e o algoritmo desempenham um papel maior. Mínimos Quadrados Não Lineares é um exemplo. Você não recebe uma fórmula explícita; tudo o que você recebe é uma receita que você precisa implementar no computador. A receita pode começar com um palpite inicial sobre quais podem ser os parâmetros e como eles podem variar. Você tenta várias combinações de parâmetros e vê qual deles fornece o menor / o maior valor da função objetivo. Essa é a abordagem da força bruta e leva muito tempo. Por exemplo,105 combinações, e que apenas coloca você na vizinhança da resposta certa se você tiver sorte. Essa abordagem é chamada de pesquisa em grade.
Ou você pode começar com um palpite e refinar esse palpite em alguma direção até que as melhorias na função objetivo sejam inferiores a algum valor. Estes são geralmente chamados de métodos de gradiente (embora existam outros que não usam o gradiente para escolher em qual direção seguir, como algoritmos genéticos e recozimento simulado). Alguns problemas como esse garantem que você encontre a resposta correta rapidamente (funções objetivas quadráticas). Outros não dão essa garantia. Você pode se preocupar com o fato de ter ficado preso em um local ideal, em vez de um ideal global, para tentar várias tentativas iniciais. Você pode achar que parâmetros totalmente diferentes fornecem o mesmo valor da função objetivo, para que você não saiba qual conjunto escolher.
E[ y] = exp{ α }
QN( α ) = - 12 N∑EuN( yEu- exp{ α } )2
α∗= lny¯em( y¯+ k )