Se você tem uma aproximação Hessian justificada, é melhor usá-lo em vez do arbitrária .B0=I
Edit: A lógica é que, se você começar perto da solução , a taxa inicial de convergência é (para qualquer ) passo linear com um fator de convergência -se for para alguma correção classificação da matriz de identidade. Assim, tentar fazer isso pequeno é muito valioso. (Isso é equivalente a pré-condicionar o sistema.) O fator de convergência melhora com o tempo e, finalmente, se aproxima de zero (convergência superlinear), mas em muitos problemas reais (especialmente os de alta dimensão), nunca se faz iterações suficientes para alcançar o regime superlinear. Assim, a velocidade inicial é bastante importante.x∗r>0r+1r+1q=∥B−10f′′(x∗)−G∥<1rG
Um caso importante é ao resolver problemas de mínimos quadrados não lineares (minimizar ), em que a aproximação de Gauss-Newton do Hessiano inicial pode ser calculado sem a necessidade de segundas derivadas. Seu uso torna o método BFGS afim invariável, ou seja, invariante sob transformações lineares de como o método de Newton, que geralmente é muito benéfico.∥F(x)∥22B0=F′(x0)TF′(x0)x
Outro caso importante é quando você resolve uma sequência de problemas relacionados. Freqüentemente, reiniciar o solucionador com a aproximação final do problema anterior do Hessian reduz significativamente o número de iterações necessárias.