A "otimização convexa on-line" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) generaliza os algoritmos de aprendizado de "minimização de arrependimento", de configurações lineares a convexas e fornece bom "arrependimento externo" . Existe uma generalização semelhante para arrependimento interno? (Não tenho muita certeza nem do que exatamente isso significaria.)