Я хотел бы отсканировать большое количество бумаг, которые я лежал, с наименьшими возможными хлопотами. Я хотел бы преобразовать их в образы с помощью простого сканирования, а затем преобразовать их в текст с помощью OCR. Есть ли хорошее приложение OCR с графическим интерфейсом, который даст мне хорошие результаты нажатием кнопки?
linux-intelligent-ocr-solution
отказ от ответственности - я тесно связан с разработкой этого решения с открытым исходным кодом
Lios может преобразовывать печать в текст с помощью сканера или камеры.
Он также может выводить текст из отсканированных изображений из других источников, таких как Pdf, изображение или папка, содержащие изображения.
Программе предоставляется полная доступность для слабовидящих.
Поскольку я тесно связан - мне бы хотелось получить обратную связь.
Сайт в Sourceforge Исходный код ФорумЕсть несколько популярных инструментов командной строки OCR, которые вы можете использовать (я не уверен, что у них есть GUI):
Tesseract (ReadMe, FAQ) (Python) Также доступен для: Tesseract. NET, Tesseract iOS OCR Engine, разработанный в HP Labs в период с 1985 по 1995 год ... и теперь в Google. Tesseract - это, вероятно, самый точный механизм OCR с открытым исходным кодом. Использование:tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
GOCR распознавание символов с открытым исходным кодом. Он преобразует отсканированные изображения текста в текстовые файлы. GOCR можно использовать с разными интерфейсами, что упрощает перенос в разные ОС и архитектуры. Он может открывать множество различных форматов изображений, а качество его улучшается ежедневно. OCRopus ™ (часто задаваемые вопросы) (написанная на Python, NumPy и SciPy). Система распознавания, ориентированная на использование крупномасштабного обучения машинам для решения проблем в анализе документов, включая вставной анализ макета, подключаемое распознавание символов, статистическое естественное языковое моделирование, языковые возможности. Двигатель OCRopus основан на двух исследовательских проектах: высокопроизводительный распознаватель почерка, разработанный в середине 90-х годов и развернутый Бюро переписи США, и новые высокопроизводительные методы анализа макета. OCRopus - это разработка, спонсируемая Google, и изначально она предназначена для высокопроизводительных и высокопроизводительных преобразований документов. Мы ожидаем, что он также станет отличной системой распознавания для многих других приложений. Tessnet2 (Open Source, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI) Tesseract - это движок OCR с открытым исходным кодом на C ++. Tessnet2 - сборка .NET, которая предоставляет очень простые методы для создания OCR. Tessnet2 находится под лицензией Apache 2 (например, tesseract), что означает, что вы можете использовать его так, как хотите, включенный в коммерческие продукты. Немногие: ABBYY CLI OCR для Linux, Asprise OCR
Для получения более полного списка проверьте: ABBYY CLI OCR для Linux в Википедии
См. также: wanghaisheng/awesome-ocr - кураторский список перспективных ресурсов OCR в GitHub.
OCR на многостраничных PDF-файлах или отсканированных документах
Это, наверное, самый простой способ. Gscan2pdf - это графический инструмент, который позволяет вам не только сканировать файлы, но и импортировать файлы и выполнять OCR. Установите gscan2pdf здесь, из Ubuntu Software Center или выполните эту команду в терминале:
sudo apt-get install gscan2pdf
Запустить gscan2pdf Импортировать pdf (Ctrl + O) Дополнительно: Инструменты> Очистить Выберите «Инструменты»> «Сохранение OCR» (Ctrl + S) Gscan2PDF может использовать настраиваемые механизмы OCR, по умолчанию tesseract-ocr
Вы можете выбрать подходящий язык. В этом случае вам нужно будет установить пакет tesseract-ocr-LANG, где LANG - это трехбуквенный код языка ISO 639-2. Прямо сейчас у вас есть 108 языков на 16.04 репо.
Запустить gscan2pdfУ меня только что был успех (до 16.04) с pdfocr.rb. Это указано в Ubuntu wiki
pdfocr.rb , но репозиторий для 16.04 не обновляется. Рубиновый скрипт выше из github, хотя все еще работает с 16.04.
Вы можете скачать его из Github. Вам понадобятся следующие пакеты:
ruby tesseract-ocr pdftk exactimage
, затем выполнил исполняемый файл pdfocr.rb и выполнил:
./pdfocf.rb -i source.pdf -o output.pdf
Дополнительно вы можете использовать параметр -l LANG. В этом случае вам нужно будет установить пакет tesseract-ocr-LANG, где LANG - это трехбуквенный код языка ISO 639-2. Сейчас у вас есть 108 языков на реестре 16.04.
Лучший и самый простой способ использовать pypdfocr, он не меняет формат pdf. pypdfocr - это ссылка на модуль python здесь.
pypdfocr your_document.pdf
В конце вы получите еще один your_document_ocr.pdf способ, которым вы хотите его с помощью текста с возможностью поиска. Приложение не меняет качество изображения. Увеличивает размер файла, добавляя текст наложения.
Я думаю, что команда довольно проста, что ей не нужен какой-либо графический интерфейс. Возможно, установка pypdfocr немного более подробно:
sudo apt install tesseract-ocr
pip install pypdfocr
gscan2pdf включает 3 разных двигателя ocr. Вы можете сканировать прямо в программу или импортировать pdf-файл в программу. Я нашел, что двигатель Tesseract отлично работает и очень прост в использовании