Outra opção é o ScanTailor . Este programa é particularmente adequado para processar várias varreduras ao mesmo tempo.
apt-get install scantailor
Infelizmente, ele funciona apenas com entradas de arquivos de imagem, mas é simples o suficiente para converter um PDF digitalizado em jpg. Aqui está uma lista que eu usei para converter um diretório inteiro de PDFs em jpgs. Se um PDF tiver n páginas, ele cria n arquivos jpg.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
Eu tinha capturas de tela prontas para compartilhar, mas não tenho representante suficiente para publicá-las.
O ScanTailor gera saída para tif; portanto, se você deseja que os arquivos retornem ao PDF, você pode usá-lo para criar um PDF para cada página.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Em seguida, você pode usar essa linha única ou um aplicativo como o PDFShuffler para mesclar um ou todos os arquivos em um PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf