Respostas:
Se você usa o Google Docs, ele possui OCR embutido.
Ao fazer o upload de algo, basta verificar a
Convert text from PDF or image files to Google Docs documents
opção.
Você pode fazer o download dos arquivos do Google Docs no formato que desejar.
Você se sente confortável na linha de comando? Se você possui fink
ou macports
instalou, é possível instalar facilmente o gocr ou o tesseract . Eu tive algum sucesso com cada um deles. Observe que o tesseract é, penso eu, a ferramenta que o Google usa para a digitalização de livros.
Para o tesseract, as imagens devem estar no formato TIF e ter extensão TIF ou tif (um F, não dois).
As ferramentas da Adobe também possuem OCR eficaz e embutido, até onde eu sei, mas nunca as usei.
Eu lutei com o mesmo problema por vários meses e senti que precisava de um fluxo de trabalho intuitivo e elegante para OCR. Eu odiava as soluções de terminal e para ter certeza de colocar o formato certo. Eu queria algo que adoraria usar. Isso me levou a criar o seguinte aplicativo:
Você pode encontrar mais informações aqui: www.condenseapp.com