Depois de obter uma direção de descida para sua função objetiva f ( x ) , você precisa escolher um comprimento de passo "bom". Você não deseja dar um passo muito grande para que a função no seu novo ponto seja maior que o ponto atual. Ao mesmo tempo, você não quer dar um passo pequeno demais, de modo que leva uma eternidade para convergir.pf( X )
A condição de Armijo basicamente sugere que um "bom" comprimento do passo é tal que você tem "uma diminuição suficiente" em no seu novo ponto. A condição é matematicamente declarada como f ( x k + α p k ) ≤ f ( x k ) + β α ∇ f ( x k ) T p k onde p k é uma direção de descida em x k e β ∈ ( 0 , 1 ) . f
f( xk+ α pk) ≤ f( xk) + βα ∇ f( xk)Tpk
pkxkβ∈ ( 0 , 1 )
A intuição por trás disso é que o valor da função no novo ponto deve estar abaixo da "linha tangente" reduzida em x k na direção de p k . Veja o livro "Numerical Optimization" de Nocedal & Wright. No capítulo 3, há uma excelente descrição gráfica da condição de diminuição suficiente do armijo.f( xk+ α pk)xkpk