Сканировать много страниц прямо в PDF-файл

Question 1

Я всегда горел на DVD. Он будет работать очень хорошо, пока ваша горелка может записывать DVD-диски, а компьютер, на котором вы устанавливаете (если отличается от горелки), может читать DVD-диски и загружаться с CD / DVD-привода.

Question 2

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

Question 3

Question 4

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Question 5

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

Question 6

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

Question 7

Question 8

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf

Question 9

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

Question 10

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Question 11

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

Question 12

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

Question 13

Question 14

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf

Question 15

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

Question 16

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Question 17

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

Question 18

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

Question 19

Question 20

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf

Question 21

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».
< / blockquote>
В нем говорится, что поддерживаются следующие форматы:

PDF

JPEG

PNG

TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

Question 22

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf

Question 23

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ 0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}

Question 24

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

Question 25

Question 26

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Question 27

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf

Question 28

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Question 29

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

Question 30

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ 0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}

Question 31

Question 32

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».
< / blockquote>
В нем говорится, что поддерживаются следующие форматы:

PDF

JPEG

PNG

TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

Question 33

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf

Question 34

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ 0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}

Question 35

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

Question 36

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Question 37

Question 38

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».
< / blockquote>
В нем говорится, что поддерживаются следующие форматы:

PDF

JPEG

PNG

TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

Ciro Santilli 新疆改造中心六四事件法轮功 · Answer 1 · 25 July 2018 в 23:09

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

Karl Bielefeldt · Answer 2 · 25 July 2018 в 23:09

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5

ответ дан Karl Bielefeldt 25 July 2018 в 23:09

1

Лично я вижу xsane так далеко от простой в использовании ... – 8128 3 October 2010 в 20:05
2

Я все время использую xsane. Мне никогда не приходило в голову, что может быть лучший инструмент. – Amanda 8 June 2011 в 19:24

Marcel Stimberg · Answer 3 · 25 July 2018 в 23:09

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

+1 для простого сканирования - это так просто и просто, но очень мощно - это особенно подходит для работы, о которой вы говорили. — 8128, 3 October 2010 в 19:56

morten · Answer 4 · 25 July 2018 в 23:09

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

msw · Answer 5 · 25 July 2018 в 23:09

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf

Ciro Santilli 新疆改造中心六四事件法轮功 · Answer 6 · 31 July 2018 в 10:31

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

Karl Bielefeldt · Answer 7 · 31 July 2018 в 10:31

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5

ответ дан Karl Bielefeldt 31 July 2018 в 10:31

1

Лично я вижу xsane так далеко от простой в использовании ... – 8128 3 October 2010 в 20:05
2

Я все время использую xsane. Мне никогда не приходило в голову, что может быть лучший инструмент. – Amanda 8 June 2011 в 19:24

Marcel Stimberg · Answer 8 · 31 July 2018 в 10:31

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

+1 для простого сканирования - это так просто и просто, но очень мощно - это особенно подходит для работы, о которой вы говорили. — 8128, 3 October 2010 в 19:56

morten · Answer 9 · 31 July 2018 в 10:31

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

msw · Answer 10 · 31 July 2018 в 10:31

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf

Ciro Santilli 新疆改造中心六四事件法轮功 · Answer 11 · 31 July 2018 в 11:32

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я думаю, что это ошибка UI.

Эта функция документирована на Help > Contents:

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».

В нем говорится, что поддерживаются следующие форматы:

PDF JPEG PNG TIFF

Интересный факт: если вы измените тип сканирования (выпадающее меню, кроме «Сканировать») в «Текст», тип файла по умолчанию становится PDF.

Karl Bielefeldt · Answer 12 · 31 July 2018 в 11:32

«Простота использования» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

5

ответ дан Karl Bielefeldt 31 July 2018 в 11:32

1

Лично я вижу xsane так далеко от простой в использовании ... – 8128 3 October 2010 в 20:05
2

Я все время использую xsane. Мне никогда не приходило в голову, что может быть лучший инструмент. – Amanda 8 June 2011 в 19:24

Marcel Stimberg · Answer 13 · 31 July 2018 в 11:32

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка).

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - Simple Scan , также в репозиториях. [D2] [!d2]

+1 для простого сканирования - это так просто и просто, но очень мощно - это особенно подходит для работы, о которой вы говорили. — 8128, 3 October 2010 в 19:56

morten · Answer 14 · 31 July 2018 в 11:32

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

msw · Answer 15 · 31 July 2018 в 11:32

Я использовал xsane до тех пор, пока не увидел этот вопрос и не подумал, что его интерфейс имеет наименьшее значение, но эффективен.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf, живущего в Ubuntu Lucid / Хранилища Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. Хорошее время попробуйте:

sudo apt-get install gscan2pdf

Ciro Santilli 新疆改造中心六四事件法轮功 · Answer 16 · 2 August 2018 в 04:29

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».
< / blockquote>
В нем говорится, что поддерживаются следующие форматы:

PDF

JPEG

PNG

TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

msw · Answer 17 · 2 August 2018 в 04:29

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf

morten · Answer 18 · 2 August 2018 в 04:29

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ 0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}

Marcel Stimberg · Answer 19 · 2 August 2018 в 04:29

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

Karl Bielefeldt · Answer 20 · 2 August 2018 в 04:29

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

msw · Answer 21 · 4 August 2018 в 21:02

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf

Karl Bielefeldt · Answer 22 · 4 August 2018 в 21:02

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Marcel Stimberg · Answer 23 · 4 August 2018 в 21:02

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

morten · Answer 24 · 4 August 2018 в 21:02

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ 0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}

Ciro Santilli 新疆改造中心六四事件法轮功 · Answer 25 · 4 August 2018 в 21:02

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».
< / blockquote>
В нем говорится, что поддерживаются следующие форматы:

PDF

JPEG

PNG

TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

msw · Answer 26 · 6 August 2018 в 04:33

Я использовал xsane до тех пор, пока не увидел этот вопрос и не считал его интерфейс, по меньшей мере, наименее эффективным, но эффективным.

Увидев этот вопрос, я пошел искать и нашел gscan2pdf , живущих в репозиториях Ubuntu Lucid / Maverick. Он использует один и тот же механизм сканирования (libsane), но пользовательский интерфейс намного больше Gnome-ish. В течение хорошего времени попробуйте:

  sudo apt-get install gscan2pdf

morten · Answer 27 · 6 August 2018 в 04:33

Сканировать страницы с USB-сканера. Используйте tesseract для OCR в PDF. Объединение нескольких страниц в один PDF-файл. Использование: scan2PDF outputfilename number_of_pages

  #! / Bin / bash # scan2PDF #Requires: tesseract 3.03 для OCR для PDF # сканирование для сканирования, я использую 1.0.24 # pdfunite для объединения нескольких PDF в один  , Я использую 0.26.5 # # Используйте scanimage -L, чтобы получить список устройств.  #, например.  device `genesys: libusb: 006: 003 '- это планшетный сканер Canon LiDE 210, а затем скопируйте / вставьте genesys: libusb: 006: 003 в SCANNER ниже.  # играть с CONTRAST для получения хороших изображений DPI = 300 TESS_LANG = и # Язык, который Tesseract использует для OCR SCANNER = genesys: libusb: 006: 003 #My USB-сканер CONTRAST = 35 # Контраст для удаления бумажного вида FILENAME = $ 1 #Agrument 1,  filename PAGES = $ 2 # Аргумент 2, количество страниц re = '^ [0-9] + $' # Проверить, является ли второй аргумент числом if!  [[$ {PAGES} = ~ $ re]];  then echo "error: Usage: $ 0 filename number_of_pages" & gt; & amp; 2;  exit 1 fi SCRIPT_NAME = `basename" $ 0 ".sh` #Directory для хранения временных файлов TMP_DIR = $ {SCRIPT_NAME} -tmp, если [-d $ {TMP_DIR}] # Проверить, существует ли уже каталог, затем echo Ошибка: каталог  $ {TMP_DIR} существует.  exit 2 fi mkdir $ {TMP_DIR} #Make и перейти к temp dir cd $ {TMP_DIR} echo Запуск Scanimage ... scanimage -d $ {SCANNER} --format = tiff --mode Color --resolution $ {DPI} -  p --contrast $ {CONTRAST} --batch-start = 1 --batch-count = $ {PAGES} --batch-prompt echo Запускает Tesseract OCR для файла в * .tif # Проходит через каждый файл tif в temp dir do  tesseract $ file $ {file% .tif} -l $ {TESS_LANG} pdf done if ["$ PAGES" = "1"] # Как много страниц, тогда cp out1.pdf ../${FILENAME}.pdf # Только один  страницы, просто скопируйте PDF обратно еще для файла в * .pdf #More страницы, объедините страницы в один PDF и скопируйте обратно pdfuniteargs + = $ {file} pdfuniteargs + = "" done pdfunite $ pdfuniteargs ../${FILENAME}.  pdf fi echo $ {FILENAME} .pdf done rm * #Done, очистить cd .. rmdir $ {TMP_DIR}

Marcel Stimberg · Answer 28 · 6 August 2018 в 04:33

Идея иметь простую утилиту сканирования была за разработкой, ну, простое сканирование - инструмент сканирования, установленный по умолчанию с 10.04 по (Приложения ‣ Графика ‣ Простая проверка). alt text [!d0]

Просто сканируйте столько страниц, сколько захотите, и выберите PDF в качестве формата файла при сохранении.

Еще одна менее простая программа, которая предлагает дополнительные функции, такие как распознавание текста, - gscan2pdf, также в репозиториях. [D1] [!d1]

Karl Bielefeldt · Answer 29 · 6 August 2018 в 04:33

«Простой в использовании» находится в глазу пользователя, но xsane предоставляет эту функцию. Выберите multipage, где он говорит, что зритель (или ударил CTRL-M), и отсюда не должно быть трудно найти.

Ciro Santilli 新疆改造中心六四事件法轮功 · Answer 30 · 6 August 2018 в 04:33

Измените имя файла из myfile.jpg на myfile.pdf в диалоговом окне сохранения Simple Scan.

Проверено на Ubuntu 14.04, Simple Scan 3.12.1.

Это работает даже несмотря на то, что в раскрывающемся списке типа файла не отображается «PDF», а только «Изображения». Я считаю это ошибкой пользовательского интерфейса.

Эта функция документирована в Help & gt; Содержание :

В диалоговом окне «Сохранить как» выберите один из поддерживаемых типов файлов или просто измените расширение в поле «Имя».
< / blockquote>
В нем говорится, что поддерживаются следующие форматы:

PDF

JPEG

PNG

TIFF

Интересный факт: если вы измените тип сканирования (раскрывающийся список, кроме «Сканировать») на «Текст», тип файла по умолчанию станет PDF.

Сканировать много страниц прямо в PDF-файл

45 ответов

Другие вопросы по тегам:

Похожие вопросы: