Respostas:
Parece livre, tentei e funciona bem para mim.
O Google Docs agora está testando um novo recurso de API que usa OCR (reconhecimento óptico de caracteres) em imagens e PDFs.
No sistema operacional Google :
A API do Google Docs testa um novo recurso que permite executar o OCR (reconhecimento óptico de caracteres) em uma imagem. Há uma demonstração ao vivo que ilustra esse recurso : você pode fazer upload de uma imagem JPG, GIF ou PNG de alta resolução com menos de 10 MB e o Google Docs extrai o texto e o converte em um novo documento. O Google menciona que "atualmente a operação pode levar até 40 segundos" e um pequeno teste mostrou que o serviço ainda não é confiável: é lento e frequentemente retorna erros.
Os resultados estão longe de serem perfeitos e você encontrará muitos erros, mas o serviço é gratuito e está em constante aprimoramento. Aqui está o resultado do OCR para este documento digitalizado :
Um documento do Google Docs pode ser exportado em vários formatos diferentes, incluindo HTML, OpenOffice e Word:
De acordo com a minha resposta no SO para Alguém conhece uma maneira de converter facilmente um PDF para um formato docx programaticamente :
Converta PDF para SVG (o ghostscript fará isso) e importe ...
... o ponto é que, embora o Word não incorpore PDF, ele incorporará SVG.
O pdfonline faz um trabalho bastante decente.
Use um programa de reconhecimento óptico de caracteres, como o Omnipage Pro, por exemplo. Ele suporta PDF como entrada de documento e Word como saída.
Você também pode experimentar o OCRTerminal, que oferece serviço gratuito por 20 páginas por mês. Eles têm um Beta Desktop Client que parece estar disponível para uso por convite (você deve contatá-los e manifestar interesse).