Recentemente encontrei o Tesseract e o OpenCV . Parece que o Tesseract é um mecanismo de OCR completo e o OpenCV pode ser usado como uma estrutura para criar um aplicativo / serviço de OCR.
Tentei usar Tesseract em algumas das minhas imagens e sua precisão parece decente. Mais tarde, me deparei com um tutorial muito simples sobre como usar o OpenCV para realizar OCR usando Python e fiquei impressionado. Em poucos minutos, terminei de treinar o sistema e sua precisão era boa. Mas é claro que essa abordagem significa que preciso treinar meu sistema extensivamente usando um grande conjunto de treinamento.
Minhas perguntas específicas são as seguintes:
- Como escolher entre o Tesseract e o OpenCV para construir um aplicativo OCR personalizado?
- Existem conjuntos de dados de treinamento disponíveis para Tesseract para diferentes idiomas. O OpenCV tem algo semelhante para que eu não tenha que começar a trabalhar para obter OCR?
- Qual é o melhor para uma aplicação comercial pretensiosa?
Alguma sugestão?
OCR accuracy tests
e você encontrará alguns gráficos. E por falar em aplicativos móveis, a maioria deles usa tesseract. Mas se você se importar em baixar alguns deles, verá que os resultados são um pouco diferentes das promessas. Eles geralmente fazem uma demonstração em vídeo em um ambiente cuidadosamente controlado e postam no youtube, mas à solta, se você escanear uma página / receita / cartão / qualquer coisa, você obterá alguns resultados engraçados.