Оптического распознавания рекомендации программного обеспечения?

GUI Ways

Установите тему здесь, а затем измените свою тему, используя инструмент настройки gnome или инструмент для настройки единства

sudo apt-get install gnome-tweak-tool
sudo apt-get install unity-tweak-tool

Скриншот скриншота Gnome tool

GUI Ways

Использование команд gsettings для изменения значков / темы / gtk

Для GTK

gsettings set org.gnome.desktop.interface gtk-theme "yourtheme"

Для темы [!d11 ]

gsettings set org.gnome.desktop.wm.preferences theme "yourtheme"

Для значков

gsettings set org.gnome.desktop.interface icon-theme 'yourtheme'
15
задан 13 January 2011 в 02:47

100 ответов

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших программ распознавания окуляров, которые я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Изменяя большинство других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

tesseract ScannedDocument.png out

Создаст файл с именем out.txt

10
ответ дан 26 May 2018 в 00:52
  • 1
    Благодаря! Я не видел, что Tesseract поддерживает вывод pdf. Вы знаете об этом? – Tim 22 October 2010 в 07:56
  • 2
    @Tim, изначально я не верю, что Tesseract поддерживает множество форматов ввода / вывода. Однако, как упоминает ответ JanC, gscan2pdf использует Tesseract для OCR, и, как следует из названия, он поддерживает вывод в формате PDF. – Tim Lytle 22 October 2010 в 15:56
  • 3
    Обратите внимание, что OCR обозначает Оптический Распознавание символов: ru.wikipedia.org/wiki/Optical_character_recognition – Jose Gómez 31 October 2014 в 18:32

Тессеракт ОРЗ

оригинальный двигатель был разработан еще в конце 80-х с HP и IBM, но он оказался одним из лучших глазных признание программного обеспечения я использовал. Это в последнее время претерпела много обновлений в движок и стал одним из наиболее всеобъемлющих инструментов распознавания на рынке. Опережая от большинства других средств распознавания текста (что выше 90-го процентиля текста матчей) он может легко превратить стандартный Тип-лицо документа в текст.

пример:

tesseract ScannedDocument.png out

будет создан файл под названием out.txt

10
ответ дан 25 July 2018 в 23:02

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших программ распознавания окуляров, которые я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Изменяя большинство других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

tesseract ScannedDocument.png out

Создаст файл с именем out.txt

10
ответ дан 27 July 2018 в 02:12

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших программ распознавания окуляров, которые я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Изменяя большинство других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

tesseract ScannedDocument.png out

Создаст файл с именем out.txt

10
ответ дан 31 July 2018 в 11:44

Тессеракт ОРЗ

оригинальный двигатель был разработан еще в конце 80-х с HP и IBM, но он оказался одним из лучших глазных признание программного обеспечения я использовал. Это в последнее время претерпела много обновлений в движок и стал одним из наиболее всеобъемлющих инструментов распознавания на рынке. Опережая от большинства других средств распознавания текста (что выше 90-го процентиля текста матчей) он может легко превратить стандартный Тип-лицо документа в текст.

пример:

tesseract ScannedDocument.png out

будет создан файл под названием out.txt

10
ответ дан 2 August 2018 в 04:23

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших Программное обеспечение распознавания глаз, которое я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Outscoring против большинства других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

  tesseract ScannedDocument.png out  

Создаст файл с именем out.txt

10
ответ дан 4 August 2018 в 20:55

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших Программное обеспечение распознавания глаз, которое я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Outscoring против большинства других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

  tesseract ScannedDocument.png out  

Создаст файл с именем out.txt

10
ответ дан 6 August 2018 в 04:28

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших Программное обеспечение распознавания глаз, которое я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Outscoring против большинства других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

  tesseract ScannedDocument.png out  

Создаст файл с именем out.txt

10
ответ дан 7 August 2018 в 22:36

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших Программное обеспечение распознавания глаз, которое я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Outscoring против большинства других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

  tesseract ScannedDocument.png out  

Создаст файл с именем out.txt

10
ответ дан 10 August 2018 в 10:42

Tesseract OCR

Оригинальный движок был разработан еще в конце 80-х годов HP и IBM, но он оказался одним из лучших Программное обеспечение распознавания глаз, которое я использовал. Недавно он подвергся многим обновлениям и стал одним из самых полных инструментов OCR на рынке. Outscoring против большинства других инструментов OCR (с чем-то в более высоком 90 процентиле текстовых совпадений), он может легко преобразовать стандартный тип документа в текст.

Ниже приведен пример:

  tesseract ScannedDocument.png out  

Создаст файл с именем out.txt

10
ответ дан 13 August 2018 в 17:16
  • 1
    Благодаря! Я не видел, что Tesseract поддерживает вывод pdf. Вы знаете об этом? – Tim 22 October 2010 в 07:56
  • 2
    @Tim, изначально я не верю, что Tesseract поддерживает множество форматов ввода / вывода. Однако, как упоминает ответ JanC, gscan2pdf использует Tesseract для OCR, и, как следует из названия, он поддерживает вывод в формате PDF. – Tim Lytle 22 October 2010 в 15:56
  • 3
    Обратите внимание, что OCR обозначает Optical Распознавание символов: ru.wikipedia.org/wiki/Optical_character_recognition – Jose Gómez 31 October 2014 в 18:32

Другой проект, который должен это сделать, - gscan2pdf

sudo apt-get install gscan2pdf

Этот проект также может использовать Tesseract, а также другие инструменты OCR с открытым исходным кодом.

8
ответ дан 26 May 2018 в 00:52

Я не знаю OCR для Ubuntu, но для Windows есть тот, у которого есть необходимые функции. Это ABBYY FineReader, это страница, но она не бесплатна

3
ответ дан 26 May 2018 в 00:52
  • 1
    Я использовал FineReader точно так же, как хочет Тим ​​(для открытия защищенных PDF-файлов) – Extender 22 October 2010 в 07:57

Свободное решение существует в repos, CuneiForm (и YAGF как интерфейс Gnome для него)

3
ответ дан 26 May 2018 в 00:52
  • 1
    Благодаря! Поддерживает ли CunieForm формат pdf в качестве входных и выходных форматов? Я не видел этого на своей странице в Википедии и на ее официальной странице. – Tim 22 October 2010 в 08:08
  • 2
    Может быть, нет, но сплит PDF в серии TIFF - простая задача в любом случае :) – Extender 22 October 2010 в 10:18

Кажется, что проект Decapod делает или будет экспортировать в PDF, поэтому Tesseract должен каким-то образом экспортировать необходимую информацию, чтобы узнать, где был найден текст.

3
ответ дан 26 May 2018 в 00:52

Adobe Acrobat (не читатель, а не бесплатное приложение) способен распознавать сканированный PDF-документ и добавлять невидимый текстовый слой поверх изображения, чтобы текст можно было выбрать и скопировать. К сожалению, мне не очень удобно проверять, где именно эта функция находится в пользовательском интерфейсе Acrobat, но я успешно использовал ее несколько раз с той же целью, о которой вы говорили.

И да, это программное обеспечение Windows, а не Linux, но, согласно базе данных приложения Wine HQ, оно работает под Wine.

1
ответ дан 26 May 2018 в 00:52

Лучшее программное обеспечение OCR обычно встроено в принтеры / сканеры / копиры. Canon IRC 3880 в моем офисе может выводить большие OCR'd pdf-файлы проще и быстрее, чем любая настольная программа, которую я знаю. Поместите книгу в лоток (несвязанный), выберите свой почтовый адрес, нажмите зеленую кнопку.

Большая часть PDF-документа OCR, который вы можете найти в сети, подходит для аналогичных машин. Проблема в том, что цена слишком высока для домашнего использования (около 12000 евро IRC).

1
ответ дан 26 May 2018 в 00:52

Мое любимое бесплатное онлайн-программное обеспечение OCR предлагает Ricoh Innovations. Это бета-программа, но я считаю, что она работает очень хорошо. Проверьте это: http://beta.rii.ricoh.com/betalabs/content/document-conversion

1
ответ дан 26 May 2018 в 00:52

OCRFeeder

Это приложение для графического интерфейса.

Он использует OCRFeeder или ocrad как движок OCR. [!d5 ]

Можно установить с помощью Software Center или с помощью

sudo apt-get install ocrfeeder
1
ответ дан 26 May 2018 в 00:52

FineReader также имеет онлайн-версию. Он утверждает, что способен обрабатывать PDF-файлы в качестве входного формата --- http://finereader.abbyyonline.com/en/Help/Faq/

0
ответ дан 26 May 2018 в 00:52

Другой проект, который должен это сделать, - gscan2pdf

sudo apt-get install gscan2pdf

Этот проект также может использовать Tesseract, а также другие инструменты OCR с открытым исходным кодом.

8
ответ дан 25 July 2018 в 23:02

бесплатное решение существует в репозитории, CunieForm (и YAGF как интерфейс GNOME для он)

3
ответ дан 25 July 2018 в 23:02
  • 1
    Благодаря! Поддерживает ли CunieForm формат pdf в качестве входных и выходных форматов? Я не видел этого на своей странице в Википедии и на ее официальной странице. – Tim 22 October 2010 в 08:08
  • 2
    Может быть, нет, но сплит PDF в серии TIFF - простая задача в любом случае :) – Extender 22 October 2010 в 10:18

похоже, что проект Десятиногих делает или будет экспортировать в pdf, так что Тессеракт надо как-то экспортировать необходимые данные, чтобы знать, где какой текст был найден.

3
ответ дан 25 July 2018 в 23:02

Лучшее программное обеспечение OCR обычно встроено в принтеры / сканеры / копиры. Canon IRC 3880 в моем офисе может выводить большие OCR'd pdf-файлы проще и быстрее, чем любая настольная программа, которую я знаю. Поместите книгу в лоток (несвязанный), выберите свой почтовый адрес, нажмите зеленую кнопку.

Большая часть PDF-документа OCR, который вы можете найти в сети, подходит для аналогичных машин. Проблема в том, что цена слишком высока для домашнего использования (около 12000 евро IRC).

1
ответ дан 25 July 2018 в 23:02

Моя любимая бесплатная онлайн программа для распознавания текста предлагают компании Ricoh инноваций. Это бета-версия программы, но я нахожу это довольно хорошо работает. Проверьте это в: http://beta.rii.ricoh.com/betalabs/content/document-conversion

1
ответ дан 25 July 2018 в 23:02

Adobe Acrobat (не читатель, а не бесплатное приложение) способен распознавать сканированный PDF-документ и добавлять невидимый текстовый слой поверх изображения, чтобы текст можно было выбрать и скопировать. К сожалению, мне не очень удобно проверять, где именно эта функция находится в пользовательском интерфейсе Acrobat, но я успешно использовал ее несколько раз с той же целью, о которой вы говорили.

И да, это программное обеспечение Windows, а не Linux, но, согласно базе данных приложения Wine HQ, оно работает под Wine.

1
ответ дан 25 July 2018 в 23:02

FineReader также имеет онлайн-версию. Он утверждает, что способен обрабатывать PDF-файлы в качестве входного формата --- http://finereader.abbyyonline.com/en/Help/Faq/

0
ответ дан 25 July 2018 в 23:02

OCRFeeder

это приложение с графическим интерфейсом.

он использует OCRFeeder или ocrad как движок распознавания.

можно установить с центра программного обеспечения или с,

sudo apt-get install ocrfeeder
1
ответ дан 25 July 2018 в 23:02

Я не знаю OCR для Ubuntu, но для Windows есть тот, у которого есть необходимые функции. Это ABBYY FineReader, это страница, но она не бесплатна

3
ответ дан 25 July 2018 в 23:02
  • 1
    Я использовал FineReader точно так же, как хочет Тим ​​(для открытия защищенных PDF-файлов) – Extender 22 October 2010 в 07:57

еще один проект, который должен быть в состоянии сделать это gscan2pdf

sudo apt-get install gscan2pdf

этот проект также может использовать Тессеракт, а также других открытых источников ОРЗ инструменты.

8
ответ дан 27 July 2018 в 02:12

бесплатное решение существует в репозитории, CunieForm (и YAGF как интерфейс GNOME для он)

3
ответ дан 27 July 2018 в 02:12
  • 1
    Благодаря! Поддерживает ли CunieForm формат pdf в качестве входных и выходных форматов? Я не видел этого на своей странице в Википедии и на ее официальной странице. – Tim 22 October 2010 в 08:08
  • 2
    Может быть, нет, но сплит PDF в серии TIFF - простая задача в любом случае :) – Extender 22 October 2010 в 10:18

Другие вопросы по тегам:

Похожие вопросы: