Digamos que eu tenha um classificador de regressão logística. No aprendizado em lote normal, eu teria um termo regularizador para evitar o excesso de ajustes e manter meus pesos pequenos. Eu também normalizava e dimensionava meus recursos.
Em um ambiente de aprendizado on-line, estou recebendo um fluxo contínuo de dados. Eu faço uma atualização de descida de gradiente com cada exemplo e depois a descarto. Devo usar o termo de escala e regularização de recursos no aprendizado on-line? Se sim, como posso fazer isso? Por exemplo, não tenho um conjunto de dados de treinamento para escalar. Também não tenho a validação definida para ajustar meu parâmetro de regularização. Se não, por que não?
No meu aprendizado on-line, recebo um fluxo de exemplos continuamente. Para cada novo exemplo, faço uma previsão. Então, na próxima etapa, obtenho o destino real e faço a atualização da descida do gradiente.