Ultimamente, tenho tentado aprender mais sobre o aprendizado on-line (é absolutamente fascinante!), E um tema que não consegui entender é como pensar na seleção de modelos em contextos offline versus online. Especificamente, suponha que treinar um classificador off-line, com base em um conjunto de dados fixo . Estimamos suas características de desempenho por meio de validação cruzada, por exemplo, e selecionamos o melhor classificador dessa maneira.D
É isso que eu tenho pensado: como, então, aplicamos a uma configuração online? Podemos supor que o melhor encontrado offline também funcionará bem como um classificador online? Faz sentido reunir alguns dados para treinar , em seguida, pegar o mesmo classificador e "operacionalizá-lo" em uma configuração online com os mesmos parâmetros encontrados em ou outra abordagem pode ser melhor? Quais são as advertências nesses casos? Quais são os principais resultados aqui? E assim por diante.S S S D
De qualquer forma, agora que está lá fora, acho que estou procurando algumas referências ou recursos que me ajudarão (e espero que outros, que tenham pensado sobre esse tipo de coisa!) Façam a transição do pensamento apenas em termos offline, e desenvolvo a estrutura mental para pensar sobre a questão da seleção de modelos e essas questões de uma maneira mais coerente à medida que minha leitura avança.