Código aberto preferido, mas não necessário.
Eu tenho o Adobe Acrobat 8 e gosto muito do recurso OCR, que pode essencialmente colocar uma camada invisível de texto OCR sobre um documento digitalizado. Portanto, o que você vê na tela é o documento digitalizado original, mas o resultado é pesquisável.
O que estou procurando é uma maneira de automatizar esse processo. Atualmente, tenho alguns scripts que usamos para processar e arquivar arquivos digitalizados e estou procurando algo que possa ser conectado diretamente a esse processo em lote para fazer o OCR de maneira semelhante ao que posso fazer com o Acrobat.
Todas as sugestões são bem-vindas, obrigado!