Estou usando scanimage
um scanner de documentos (Canon DR-2510C) que suporta digitalização duplex. Infelizmente, o driver SANE não oferece suporte à detecção de páginas em branco, de modo que, com páginas mistas (frente e verso), as páginas em branco entram no resultado da digitalização.
Gostaria de me livrar automaticamente dessas páginas em branco ao pós-processar a saída da digitalização, por isso estou procurando uma ferramenta de linha de comando capaz de detectar se um arquivo TIFF ou PNM consiste principalmente de pixels brancos).
Alguma ideia?
Esta é a solução que encontrei com base na resposta de lesmana:
for i in "${DEST_DIR}/out"*.pnm; do
histogram=`convert "${i}" -threshold 50% -format %c histogram:info:-`
white=`echo "${histogram}" | grep "white" | sed -n 's/^ *\(.*\):.*$/\1/p'`
black=`echo "${histogram}" | grep "black" | sed -n 's/^ *\(.*\):.*$/\1/p'`
blank=`echo "scale=4; ${black}/${white} < 0.005" | bc`
if [ ${blank} -eq "1" ]; then
echo "${i} seems to be blank - removing it..."
rm "${i}"
fi
done