Otimização matemática em uma função barulhenta

Seja uma função bastante agradável (por exemplo, contínua, diferenciável, não há máximos locais demais, talvez côncavos etc.). Quero encontrar um máximo de : um valor que faça o maior possível. $f:\mathbb{R}^d \to \mathbb{R}$ $f$ $x \in \mathbb{R}^d$ $f(x)$

Se eu tivesse um procedimento para avaliar precisão em qualquer entrada de minha escolha, eu poderia usar técnicas padrão de otimização matemática : escalada, descida de gradiente (bem, ascensão de gradiente), etc. No entanto, em meu aplicativo, não maneira de avaliar exatamente. Em vez disso, tenho uma maneira de estimar o valor de . $f$ $f(x)$ $f(x)$

Em particular, dado qualquer e qualquer , eu tenho um oráculo que produzirá uma estimativa de e cujo erro esperado é aproximadamente . O tempo de execução dessa invocação do oracle é proporcional a . (É implementado por um tipo de simulação; a precisão da simulação aumenta com a raiz quadrada do número de tentativas, e posso escolher quantas tentativas executar, para poder escolher a precisão desejada.) Portanto, isso me dá uma maneira de obter uma estimativa de qualquer precisão que eu deseje, mas quanto mais preciso eu quero que a estimativa seja, mais tempo levará. $x$ $\varepsilon$ $f(x)$ $\varepsilon$ $1/\varepsilon^2$

Dado esse oráculo barulhento para , existem técnicas para calcular o máximo de mais eficiente possível? (Ou, mais precisamente, encontrando um máximo aproximado.) Existem variantes de escalada, descida de gradiente etc. que funcionam nesse modelo? $f$ $f$

É claro que eu poderia fixar um valor muito pequeno de e aplicar escalada ou descida de gradiente com este oráculo, mantendo o mesmo toda parte. No entanto, isso pode ser desnecessariamente ineficiente: talvez não precisemos de uma estimativa tão precisa perto do início, enquanto a precisão perto do fim, quando você estiver se concentrando na solução, é mais importante. Existe alguma maneira de tirar proveito da minha capacidade de controlar a precisão de minha estimativa dinamicamente, para tornar o processo de otimização mais eficiente? Esse tipo de problema já foi estudado antes? $\varepsilon$ $\varepsilon$

optimization approximation

— DW
fonte

ϵ

$\epsilon$

cibersincronicidade, encontrou exatamente esse caso recentemente em um programa de AG. concordou com rs acima que o recozimento simulado onde a precisão da avaliação da função corresponde aproximadamente à diminuição da temperatura deve funcionar. Outra idéia é fazer apenas um número fixo de amostras em cada ponto e tomar a média como estimativa. uma teoria mais avançada pode apenas dizer que você não pode obter nada por nada e que não há atalho para avaliações que melhoram a otimização.

— vzn

$f(x,p)$ $f(x+\Delta x, p + \Delta p)$ $p$ $\Delta x$ $\Delta p$

Algumas técnicas usadas na otimização estocástica e otimização robusta podem ser aplicáveis.
$\frac{\partial f}{\partial x}\approx 0$ $\Delta x$ $\Delta p$
$\frac{\partial f}{\partial x}(\tilde{x}, \tilde{p})$ $f(\tilde{x}, \tilde{p})$
$\Delta p$ $\Delta x$ $1/\epsilon^2$
A troca de ruído versus tempo de execução é o que diferencia esse problema dos problemas mais bem estudados. Os problemas em que o ruído é inevitável são mais comuns e melhor estudados.

— Thomas Klimpel
fonte

f (x, p)

$f(x,p)$

f^{*} (x + Δ x, Δ p)

$f^*(x+\Delta x,\Delta p)$

p

$p$

p = 0

$p=0$

f^{*}

$f^*$ ) A otimização estocástica e a otimização robusta parecem mais ou menos o tipo de coisa que eu estava procurando, então isso é muito útil. Obrigado.

— DW

p = 0

$p=0$

f (x, 0)

$f(x,0)$

f (x + Δ x, Δ p)

$f(x+\Delta x, \Delta p)$

Δ x

$\Delta x$

Δ p

$\Delta p$