Estou tentando entender como o método de otimização baseado em adjuntos funciona para uma otimização restrita do PDE. Particularmente, estou tentando entender por que o método adjunta é mais eficiente para problemas em que o número de variáveis de design é grande, mas o "número de equações é pequeno".
O que eu entendo:
Considere o seguinte problema de otimização restrita do PDE:
onde é uma função objetiva (suficientemente contínua) de uma variável de projeto vetorial e um vetor de variável de campo desconhecida que depende das variáveis de design, e é a forma residual do PDE.
Claramente, podemos as primeiras variações de I e R como
Introduzindo um vetor de multiplicadores de lagrange , a variação na função objetivo pode ser escrita como
Reorganizando os termos, podemos escrever:
Portanto, se formos capazes de resolver modo que
Então, o gradiente é avaliado somente em termos das variáveis de design .
Assim, um algoritmo de otimização baseado em loop repetiria as seguintes etapas:
- Dadas as variáveis de design atuais
- Solução para as variáveis de campo (do PDE)
- Resolva para os multiplicadores de lagrange (da equação adjunta)
- Calcular gradientes
- Atualizar variáveis de design
Minha pergunta
Como esse "truque" adicional melhora o custo da otimização por iteração no caso em que o número de variáveis de design é grande? Ouvi dizer que o custo da avaliação de gradiente para o método adjacente é 'independente' do número de variáveis de design. Mas como exatamente isso é verdade?
Tenho certeza de que há algo muito óbvio que de alguma forma estou ignorando.