Сканировать много страниц прямо в PDF-файл

Я всегда горел на DVD. Он будет работать очень хорошо, пока ваша горелка может записывать DVD-диски, а компьютер, на котором вы устанавливаете (если отличается от горелки), может читать DVD-диски и загружаться с CD / DVD-привода.

33
задан 3 October 2010 в 15:11

45 ответов

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

3
ответ дан 25 July 2018 в 23:09

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5
ответ дан 25 July 2018 в 23:09
  • 1
    Лично я вижу xsane так далеко от простой в использовании ... – 8128 3 October 2010 в 20:05
  • 2
    Я все время использую xsane. Мне никогда не приходило в голову, что может быть лучший инструмент. – Amanda 8 June 2011 в 19:24

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

36
ответ дан 25 July 2018 в 23:09
  • 1
    +1 для простого сканирования - это так просто и просто, но очень мощно - это особенно подходит для работы, о которой вы говорили. – 8128 3 October 2010 в 19:56

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash #scan2PDF #Requires: tesseract 3.03 for OCR to PDF # scanimage for scanning, I use 1.0.24 # pdfunite to merge multiple PDF into one, I use 0.26.5 # # Use scanimage -L to get a list of devices. # e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner # then copy/paste genesys:libusb:006:003 into SCANNER below. # play with CONTRAST to get good images DPI=300 TESS_LANG=nor #Language that Tesseract uses for OCR SCANNER=genesys:libusb:006:003 #My USB scanner CONTRAST=35 #Contrast to remove paper look FILENAME=$1 #Agrument 1,filename PAGES=$2 #Argument 2, number of pages re='^[0-9]+$' #Check if second argument is a number if ! [[ ${PAGES} =~ $re ]] ; then echo "error: Usage: $0 filename number_of_pages" >&2; exit 1 fi SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files TMP_DIR=${SCRIPT_NAME}-tmp if [ -d ${TMP_DIR} ] #Check if it exists a directory already then echo Error: The directory ${TMP_DIR} exists. exit 2 fi mkdir ${TMP_DIR} #Make and go to temp dir cd ${TMP_DIR} echo Starts Scanimage... scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES} --batch-prompt echo Starts Tesseract OCR for file in *.tif #Goes through every tif file in temp dir do tesseract $file ${file%.tif} -l ${TESS_LANG} pdf done if [ "$PAGES" = "1" ] #How many pages then cp out1.pdf ../${FILENAME}.pdf #Only one page, just copy the PDF back else for file in *.pdf #More pages, merge the pages into one PDF and copy back do pdfuniteargs+=${file} pdfuniteargs+=" " done pdfunite $pdfuniteargs ../${FILENAME}.pdf fi echo ${FILENAME}.pdf done rm * #Done, clean up cd .. rmdir ${TMP_DIR}
0
ответ дан 25 July 2018 в 23:09

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf
3
ответ дан 25 July 2018 в 23:09

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

3
ответ дан 31 July 2018 в 10:31

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5
ответ дан 31 July 2018 в 10:31
  • 1
    Лично я вижу xsane так далеко от простой в использовании ... – 8128 3 October 2010 в 20:05
  • 2
    Я все время использую xsane. Мне никогда не приходило в голову, что может быть лучший инструмент. – Amanda 8 June 2011 в 19:24

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

37
ответ дан 31 July 2018 в 10:31
  • 1
    +1 для простого сканирования - это так просто и просто, но очень мощно - это особенно подходит для работы, о которой вы говорили. – 8128 3 October 2010 в 19:56

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash #scan2PDF #Requires: tesseract 3.03 for OCR to PDF # scanimage for scanning, I use 1.0.24 # pdfunite to merge multiple PDF into one, I use 0.26.5 # # Use scanimage -L to get a list of devices. # e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner # then copy/paste genesys:libusb:006:003 into SCANNER below. # play with CONTRAST to get good images DPI=300 TESS_LANG=nor #Language that Tesseract uses for OCR SCANNER=genesys:libusb:006:003 #My USB scanner CONTRAST=35 #Contrast to remove paper look FILENAME=$1 #Agrument 1,filename PAGES=$2 #Argument 2, number of pages re='^[0-9]+$' #Check if second argument is a number if ! [[ ${PAGES} =~ $re ]] ; then echo "error: Usage: $0 filename number_of_pages" >&2; exit 1 fi SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files TMP_DIR=${SCRIPT_NAME}-tmp if [ -d ${TMP_DIR} ] #Check if it exists a directory already then echo Error: The directory ${TMP_DIR} exists. exit 2 fi mkdir ${TMP_DIR} #Make and go to temp dir cd ${TMP_DIR} echo Starts Scanimage... scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES} --batch-prompt echo Starts Tesseract OCR for file in *.tif #Goes through every tif file in temp dir do tesseract $file ${file%.tif} -l ${TESS_LANG} pdf done if [ "$PAGES" = "1" ] #How many pages then cp out1.pdf ../${FILENAME}.pdf #Only one page, just copy the PDF back else for file in *.pdf #More pages, merge the pages into one PDF and copy back do pdfuniteargs+=${file} pdfuniteargs+=" " done pdfunite $pdfuniteargs ../${FILENAME}.pdf fi echo ${FILENAME}.pdf done rm * #Done, clean up cd .. rmdir ${TMP_DIR}
0
ответ дан 31 July 2018 в 10:31

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf
3
ответ дан 31 July 2018 в 10:31

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

3
ответ дан 31 July 2018 в 11:32

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5
ответ дан 31 July 2018 в 11:32
  • 1
    Лично я вижу xsane так далеко от простой в использовании ... – 8128 3 October 2010 в 20:05
  • 2
    Я все время использую xsane. Мне никогда не приходило в голову, что может быть лучший инструмент. – Amanda 8 June 2011 в 19:24

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

37
ответ дан 31 July 2018 в 11:32
  • 1
    +1 для простого сканирования - это так просто и просто, но очень мощно - это особенно подходит для работы, о которой вы говорили. – 8128 3 October 2010 в 19:56

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash #scan2PDF #Requires: tesseract 3.03 for OCR to PDF # scanimage for scanning, I use 1.0.24 # pdfunite to merge multiple PDF into one, I use 0.26.5 # # Use scanimage -L to get a list of devices. # e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner # then copy/paste genesys:libusb:006:003 into SCANNER below. # play with CONTRAST to get good images DPI=300 TESS_LANG=nor #Language that Tesseract uses for OCR SCANNER=genesys:libusb:006:003 #My USB scanner CONTRAST=35 #Contrast to remove paper look FILENAME=$1 #Agrument 1,filename PAGES=$2 #Argument 2, number of pages re='^[0-9]+$' #Check if second argument is a number if ! [[ ${PAGES} =~ $re ]] ; then echo "error: Usage: $0 filename number_of_pages" >&2; exit 1 fi SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files TMP_DIR=${SCRIPT_NAME}-tmp if [ -d ${TMP_DIR} ] #Check if it exists a directory already then echo Error: The directory ${TMP_DIR} exists. exit 2 fi mkdir ${TMP_DIR} #Make and go to temp dir cd ${TMP_DIR} echo Starts Scanimage... scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES} --batch-prompt echo Starts Tesseract OCR for file in *.tif #Goes through every tif file in temp dir do tesseract $file ${file%.tif} -l ${TESS_LANG} pdf done if [ "$PAGES" = "1" ] #How many pages then cp out1.pdf ../${FILENAME}.pdf #Only one page, just copy the PDF back else for file in *.pdf #More pages, merge the pages into one PDF and copy back do pdfuniteargs+=${file} pdfuniteargs+=" " done pdfunite $pdfuniteargs ../${FILENAME}.pdf fi echo ${FILENAME}.pdf done rm * #Done, clean up cd .. rmdir ${TMP_DIR}
0
ответ дан 31 July 2018 в 11:32

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf
3
ответ дан 31 July 2018 в 11:32

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

< / blockquote>

В нем говорится, что поддерживаются следующие форматы:

  • PDF
  • JPEG
  • PNG
  • TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

3
ответ дан 2 August 2018 в 04:29

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf  
3
ответ дан 2 August 2018 в 04:29

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ ​​0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}  
0
ответ дан 2 August 2018 в 04:29

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

37
ответ дан 2 August 2018 в 04:29

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5
ответ дан 2 August 2018 в 04:29

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf  
3
ответ дан 4 August 2018 в 21:02

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5
ответ дан 4 August 2018 в 21:02

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

37
ответ дан 4 August 2018 в 21:02

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ ​​0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}  
0
ответ дан 4 August 2018 в 21:02

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

< / blockquote>

В нем говорится, что поддерживаются следующие форматы:

  • PDF
  • JPEG
  • PNG
  • TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

3
ответ дан 4 August 2018 в 21:02

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf  
3
ответ дан 6 August 2018 в 04:33

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ ​​0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}  
0
ответ дан 6 August 2018 в 04:33

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

37
ответ дан 6 August 2018 в 04:33

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5
ответ дан 6 August 2018 в 04:33

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

< / blockquote>

В нем говорится, что поддерживаются следующие форматы:

  • PDF
  • JPEG
  • PNG
  • TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

3
ответ дан 6 August 2018 в 04:33

Другие вопросы по тегам:

Похожие вопросы: