Какое лучшее, самое простое решение для распознавания текста?

Я хотел бы отсканировать большое количество бумаг, которые я лежал, с наименьшими возможными хлопотами. Я хотел бы преобразовать их в образы с помощью простого сканирования, а затем преобразовать их в текст с помощью OCR. Есть ли хорошее приложение OCR с графическим интерфейсом, который даст мне хорошие результаты нажатием кнопки?

1
задан 22 March 2013 в 21:58

6 ответов

linux-intelligent-ocr-solution

отказ от ответственности - я тесно связан с разработкой этого решения с открытым исходным кодом

Lios может преобразовывать печать в текст с помощью сканера или камеры.

Он также может выводить текст из отсканированных изображений из других источников, таких как Pdf, изображение или папка, содержащие изображения.

Программе предоставляется полная доступность для слабовидящих.

Поскольку я тесно связан - мне бы хотелось получить обратную связь.

Сайт в Sourceforge Исходный код Форум
8
ответ дан 26 May 2018 в 00:06
  • 1
    Где документация по использованию? lios не так интуитивно, как я надеялся. – a coder 29 December 2014 в 17:32
  • 2
    Проект перемещен здесь . – Suzana 18 October 2015 в 18:28
  • 3
    Можно ли запустить его через командную строку только в режиме безглавых на сервере? – Deadlock 16 November 2015 в 17:04

Есть несколько популярных инструментов командной строки OCR, которые вы можете использовать (я не уверен, что у них есть GUI):

Tesseract (ReadMe, FAQ) (Python) Также доступен для: Tesseract. NET, Tesseract iOS OCR Engine, разработанный в HP Labs в период с 1985 по 1995 год ... и теперь в Google. Tesseract - это, вероятно, самый точный механизм OCR с открытым исходным кодом. Использование:
tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
GOCR распознавание символов с открытым исходным кодом. Он преобразует отсканированные изображения текста в текстовые файлы. GOCR можно использовать с разными интерфейсами, что упрощает перенос в разные ОС и архитектуры. Он может открывать множество различных форматов изображений, а качество его улучшается ежедневно. OCRopus ™ (часто задаваемые вопросы) (написанная на Python, NumPy и SciPy). Система распознавания, ориентированная на использование крупномасштабного обучения машинам для решения проблем в анализе документов, включая вставной анализ макета, подключаемое распознавание символов, статистическое естественное языковое моделирование, языковые возможности. Двигатель OCRopus основан на двух исследовательских проектах: высокопроизводительный распознаватель почерка, разработанный в середине 90-х годов и развернутый Бюро переписи США, и новые высокопроизводительные методы анализа макета. OCRopus - это разработка, спонсируемая Google, и изначально она предназначена для высокопроизводительных и высокопроизводительных преобразований документов. Мы ожидаем, что он также станет отличной системой распознавания для многих других приложений. Tessnet2 (Open Source, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI) Tesseract - это движок OCR с открытым исходным кодом на C ++. Tessnet2 - сборка .NET, которая предоставляет очень простые методы для создания OCR. Tessnet2 находится под лицензией Apache 2 (например, tesseract), что означает, что вы можете использовать его так, как хотите, включенный в коммерческие продукты.

Немногие: ABBYY CLI OCR для Linux, Asprise OCR

Для получения более полного списка проверьте: ABBYY CLI OCR для Linux в Википедии

См. также: wanghaisheng/awesome-ocr - кураторский список перспективных ресурсов OCR в GitHub.

8
ответ дан 26 May 2018 в 00:06

Gscan2PDF

OCR на многостраничных PDF-файлах или отсканированных документах

Это, наверное, самый простой способ. Gscan2pdf - это графический инструмент, который позволяет вам не только сканировать файлы, но и импортировать файлы и выполнять OCR. Установите gscan2pdf здесь, из Ubuntu Software Center или выполните эту команду в терминале:

sudo apt-get install gscan2pdf
Запустить gscan2pdf Импортировать pdf (Ctrl + O) Дополнительно: Инструменты> Очистить Выберите «Инструменты»> «Сохранение OCR» (Ctrl + S)

Gscan2PDF может использовать настраиваемые механизмы OCR, по умолчанию tesseract-ocr

Вы можете выбрать подходящий язык. В этом случае вам нужно будет установить пакет tesseract-ocr-LANG, где LANG - это трехбуквенный код языка ISO 639-2. Прямо сейчас у вас есть 108 языков на 16.04 репо.

Запустить gscan2pdf
6
ответ дан 26 May 2018 в 00:06
  • 1
    Я не могу ничего сделать с этим программным обеспечением. Нет достаточного обнаружения вообще. Было бы здорово получить все тестовые образцы приложений до их рекомендаций. – Léo Léopold Hertz 준영 14 June 2016 в 23:32
  • 2
    gscan2pdf для 16.04 хотя бы не имеет сочетания клавиш Ctrl + i. Открытие файла PDF правильно идентифицирует «страницы для извлечения», но выбор «ok» ничего не делает. – user75505 16 November 2016 в 23:51

У меня только что был успех (до 16.04) с pdfocr.rb. Это указано в Ubuntu wiki

pdfocr.rb , но репозиторий для 16.04 не обновляется. Рубиновый скрипт выше из github, хотя все еще работает с 16.04.

Вы можете скачать его из Github. Вам понадобятся следующие пакеты:

ruby tesseract-ocr pdftk exactimage

, затем выполнил исполняемый файл pdfocr.rb и выполнил:

./pdfocf.rb -i source.pdf -o output.pdf

Дополнительно вы можете использовать параметр -l LANG. В этом случае вам нужно будет установить пакет tesseract-ocr-LANG, где LANG - это трехбуквенный код языка ISO 639-2. Сейчас у вас есть 108 языков на реестре 16.04.

2
ответ дан 26 May 2018 в 00:06

Лучший и самый простой способ использовать pypdfocr, он не меняет формат pdf. pypdfocr - это ссылка на модуль python здесь.

pypdfocr your_document.pdf

В конце вы получите еще один your_document_ocr.pdf способ, которым вы хотите его с помощью текста с возможностью поиска. Приложение не меняет качество изображения. Увеличивает размер файла, добавляя текст наложения.

Я думаю, что команда довольно проста, что ей не нужен какой-либо графический интерфейс. Возможно, установка pypdfocr немного более подробно:

sudo apt install tesseract-ocr 
pip install pypdfocr 
2
ответ дан 26 May 2018 в 00:06
  • 1
    Это очень интересный инструмент, хотя я думаю, что OP хотел, чтобы инструмент GUI создавал текстовый файл, а не сэндвич PDF. Было бы неплохо, если бы вы могли включить веб-сайт проекта. – Andrea Lazzarotto 3 February 2018 в 23:10
  • 2
    @AndreaLazzarotto Да, я видел, но так как comand настолько просто, я думаю, многие люди могут использовать терминал для этого. поэтому я решил включить решение здесь – Eduard Florinescu 3 February 2018 в 23:19
  • 3
    Как совпадение, совсем недавно я обнаружил «ocrmypdf». Вы проверили это? Это очень здорово. :) – Andrea Lazzarotto 4 February 2018 в 00:01
  • 4
    @AndreaLazzarotto кажется хорошей альтернативой, вы можете отправить ответ;) Я попробую, чтобы посмотреть, как это работает :) – Eduard Florinescu 4 February 2018 в 00:12
  • 5
    @AndreaLazzarotto Кажется, не так просто установить ocrmypdf на ubuntu 16.04 github.com/jbarlow83/OCRmyPDF/issues/118 – Eduard Florinescu 4 February 2018 в 00:17

gscan2pdf включает 3 разных двигателя ocr. Вы можете сканировать прямо в программу или импортировать pdf-файл в программу. Я нашел, что двигатель Tesseract отлично работает и очень прост в использовании

0
ответ дан 26 May 2018 в 00:06

Другие вопросы по тегам:

Похожие вопросы: