2
Filtrando imagens meio "tonificadas" para processamento de OCR
Eu tenho um material PDF digitalizado no qual desejo adicionar a camada de texto oculto, para poder indexar o documento. Usei o dispositivo de saída tiff em preto e branco ghostscript (tiffg4) para extrair páginas como imagens tiff, e aqui está um exemplo de como elas são: O processamento desta …