Perguntas com a marcação «online-learning»

1
Quais são as melhores compensações possíveis de tempo / erro para solução aproximada de programas lineares?
Para concretização, considere o LP para resolver um jogo de soma zero para dois jogadores em que cada jogador tem ações. Suponha que cada entrada da matriz de pagamento tenha no máximo 1 em valor absoluto. Para simplificar, não vamos fazer suposições de escassez.AnnnUMAUMAA Suponha que o tempo de execução …

1
O Problema de Warren Buffett
Aqui está uma abstração de um problema de aprendizado / bandido on-line em que estive trabalhando no verão. Eu nunca vi um problema como esse antes e parece bastante interessante. Se você conhece algum trabalho relacionado, eu gostaria de receber referências. O problema A configuração é a de bandidos com …

2
Arrependimento interno na otimização convexa on-line
A "otimização convexa on-line" de Zinkevich ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) generaliza os algoritmos de aprendizado de "minimização de arrependimento", de configurações lineares a convexas e fornece bom "arrependimento externo" . Existe uma generalização semelhante para arrependimento interno? (Não tenho muita certeza nem do que exatamente isso significaria.)


5
Quais são as boas referências para entender o aprendizado on-line?
Especificamente, estou pedindo recursos para aprender sobre sistemas de aprendizado de máquina que podem atualizar suas respectivas redes de crenças (ou equivalente) durante a operação. Eu já encontrei alguns, embora não os tenha marcado como favorito. Como você pode imaginar, é um tópico bastante desafiador para pesquisar na internet.
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.