Existe alguma biblioteca OCR gratuita para Android? [fechadas]


148

Estou procurando um Java OCR que roda no Android, mas o Asprise não parece ser um OCR independente da plataforma. existe algum Java OCR de código aberto / gratuito que eu possa usar para o desenvolvimento de aplicativos Android?


9
Este questionada deve ser reaberto, É uma questão muito importante e válida
Utsav Gupta

5
O Google lançou recentemente uma API de OCR: developers.google.com/vision/text-overview
Wirling

Respostas:


38

O OCR pode consumir bastante a CPU; talvez você queira reconsiderá-lo em um telefone inteligente.

Além disso, que eu saiba, as bibliotecas populares de OCR são Aspire e Tesseract . Como o Java não é direto, você não receberá uma biblioteca de OCR do Android.

No entanto, o Tesseract é de código aberto (de fato hospedado no GitHub); para que você possa dedicar algum tempo para portar o subconjunto necessário ao Java. Meu entendimento é que não é C ++ insano , portanto, dependendo do quanto você precisa de OCR, pode valer a pena.

Resposta tão curta: Não.

Resposta longa: se você estiver disposto a trabalhar para isso.


2
portando-o, você quer dizer reescrever o subconjunto em Java? isso pode exigir muito esforço, então não há um 100% Java OCR por aí?
user121196

13
Eu recomendaria tentar agrupar o Tesseract em uma camada JNI por meio do Android NDK, em vez de tentar portá-lo para o Java do Android. O Tesseract já parece estar portado para o ARM, portanto, deve ser mais fácil colocar uma API JNI em cima dele. Além disso, isso o mantém mais rápido que qualquer porta Java e simplificaria a manutenção a longo prazo.
CommonsWare

15
Já existe uma interface JNI do Tesseract para Java chamada Tessjeract. code.google.com/p/tesjeract
sventechie 04/12/2009

1
O Tesseract não fica a uma curta caminhada de C para java. O código que eu vi é altamente idiomático dos anos 80 C e não é facilmente transportável para outros idiomas.
plinth

2
@vincent desapareceu no ano passado. Versão JNA já está disponível: github.com/nguyenq/tess4j mas também um garfo Android: github.com/rmtheis/tess-two
sventechie

21

Estou tendo muita sorte com o tesseract-android-tools


A questão foi encerrada, mas é bom encontrar alguém que tenha tido resultados positivos. É muito difícil encontrar pessoas nesses projetos do tipo sourceforge. Pergunta: você tentou o Tesseract com digitalizações de imagens de passaportes ou documentos de identificação? Parece ok com PDFs de texto, mas estou tendo dificuldades com imagens.
PKHunter 02/09

Eu não experimentá-lo com qualquer coisa que tivesse imagens em diante, foi apenas um documento com texto (o mesmo tipo de letra, tipo de letra, tamanho)
Ben Pearson

Espero que ele trabalha para mim
Romantic Electron

20

Outra opção seria postar a imagem em um aplicativo da Web (possivelmente posteriormente) e processá-la no OCR sem os problemas da porta C ++ -> Java e possivelmente entupir a CPU móvel.


idéia muito boa: DI supor que você significou um serviço web (asmx) graças
Omidoo


4

Sim existe.

Mas o OCR é muito vasto. Conheço um aplicativo Android que possui um recurso de OCR, mas esse pode não ser o tipo de OCR que você está procurando.

Esse aplicativo de código aberto é chamado Aedict e faz OCR em caracteres japoneses manuscritos. Não é tão lento.

Se não for o que você está procurando, especifique qual tipo de caractere e qual entrada de dados (imagem ou histórico de toque XY).


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.