Um hiperparâmetro é simplesmente um parâmetro que afeta, total ou parcialmente, outros parâmetros. Eles não resolvem diretamente o problema de otimização que você enfrenta, mas otimizam os parâmetros que podem resolver o problema (daí o hiper , porque eles não fazem parte do problema de otimização, mas são "addons"). Pelo que vi, mas não tenho referência, essa relação é unidirecional (um hiperparâmetro não pode ser influenciado pelos parâmetros em que influencia, portanto também o hiper ). Eles geralmente são introduzidos em esquemas de regularização ou meta-otimização.
Por exemplo, seu parâmetro pode afetar livremente e para ajustar o custo de regularização (mas e não influenciam ). Assim, é um hiperparâmetro para e . Se você tivesse um parâmetro adicional influenciando , seria um hiperparâmetro para e um hiperparâmetro para e (mas nunca vi essa nomenclatura, mas não acho que seria errado) se eu vi).λμσμσλλμστλλμσ
Achei o conceito de hiperparâmetro muito útil para validação cruzada, porque ele lembra a hierarquia de parâmetros, além de lembrar que, se você ainda está modificando (hiper) parâmetros, ainda está validando cruzadamente e não generalizando, portanto, deve tenha cuidado com suas conclusões (para evitar o pensamento circular).