Edição final com todos os recursos atualizados:
Para um projeto, estou aplicando algoritmos de aprendizado de máquina para classificação.
Desafio: dados rotulados bastante limitados e muito mais dados não rotulados.
Metas:
- Aplicar classificação semi-supervisionada
- Aplique um processo de rotulagem semi-supervisionado (conhecido como aprendizado ativo)
Encontrei muitas informações de trabalhos de pesquisa, como a aplicação de EM, SVM transdutivo ou S3VM (Semi-supervisionado SVM) ou, de alguma forma, uso de LDA, etc.
Pergunta: Onde estão as implementações e fontes práticas?
Atualização final (com base nas ajudas fornecidas por mpiktas, bayer e Dikran Marsupial)
Aprendizagem semi-supervisionada:
- TSVM: em SVMligth e SVMlin .
- EM Naive Bayes em Python
- EM no projeto LinePipe
Aprendizado ativo:
- Dualista : uma implementação de aprendizado ativo com código fonte na classificação de texto
- Esta página da web oferece uma maravilhosa visão geral do aprendizado ativo.
- Um workshop experimental de Design: aqui .
Aprendizagem profunda:
- Vídeo introdutório aqui .
- Site geral .
- Tutorial de aprendizado de recursos não supervisionados e aprendizado profundo de Stanford .