Как сканировать текстовые документы из командной строки?

Мне нравится, как simple-scan создает небольшие PDF-файлы для текстовых документов. Увы, поскольку я обновил Ubuntu 17.10 (и до 18.04), ключи C-1 (сканирование 1 страницы) и Cn больше не работают поэтому я должен двигать мышью (что медленно), поэтому я ищу альтернативы.

Скомпилируйте файл PDF из нескольких изображений, отсканированных с помощью scanimage --batch и Сканирование с терминала предлагает отличный подход:

$ scanimage --format=tiff | convert tiff:- scan.pdf

Увы, файл scan.pdf равен 10M - для страницы, которая сканируется simple-scan в 164k PDF-файл .

Я перепробовал все комбинации:

for mode in gray line; do 
  for format in png tiff jpeg; do 
    scanimage --mode $mode --resolution 300 --format=$format | convert $format:- $mode-$format.pdf
    ls -h $mode-$format.pdf
  done
done

и получил

5.9M gray-png.pdf
11M  gray-tiff.pdf
1.1M gray-jpeg.pdf
288K line-png.pdf
11M  line-tiff.pdf
1.5M line-jpeg.pdf

IOW, единственные опции, обеспечивающие приличный размер файла, - --mode line --format png.

Однако качество сканирования оставляет желать лучшего (например, все строки имеют одинаковый вес - черный, серой шкалы нет, много «грязи»). gray производит приличное качество, но размеры файлов абсурдно огромны.

Итак, как мне отсканировать текстовый документ в PDF, как это делает simple-scan в режиме text, не используя мою мышь?

PS. Я спросил об этом в Unix и не получил ответов.

0
задан 2 July 2018 в 04:03

0 ответов

Другие вопросы по тегам:

Похожие вопросы: