0
ответов

Извлечь текст из изображения

Я ищу программное обеспечение, которое распознает текст в изображениях. Я опробовал все инструменты, упомянутые здесь (gocr, fuzzyocr, libhocr0, ocrad, ocrfeeder, ocropus, tesseract-ocr, cuneiform). Мой вклад был ...
вопрос задан: 5 August 2018 20:56
0
ответов

Tesseract не распознает несколько языков

Я установил tesseract-ocr-all, я хочу преобразовать документ в греческий и английский tesseract input.tif output -l ell Дает мне документ на греческом языке без английского. Не использовать эту команду ...
вопрос задан: 16 May 2018 18:30
0
ответов

Преобразование изображений pdf в текст

У меня есть 500-страничная версия PDF-книги 15-го века. Я хочу преобразовать его в один файл txt любого формата, чтобы иметь возможность работать с ним и / или экспортировать его в epub. Калибр не может обработать его. ...
вопрос задан: 18 May 2017 15:08
0
ответов

Преобразование отображает PDF для отправки текстовых сообщений

У меня есть сканирование PDF на 500 страниц книги 15-го века. Я хочу преобразовать его в единственный txt файл любого формата, чтобы смочь работать над ним и/или экспортировать его в epub. Калибр не может обработать его...
вопрос задан: 18 May 2017 15:08
0
ответов

Почему текст OCR распознан с пробелами после каждого символа?

Я пытаюсь получить все свои отсканированные документы и выбросить те противные бумаги. Для упрощения этого процесса, я недавно купил сканер ADS-2100e Брата. Я думал, что этот сканер мог создать OCR-PDF на USB-...
вопрос задан: 17 March 2017 22:40
0
ответов

Как использовать OCR для частичного захвата экрана для получения текста?

Когда я все еще пользовался Windows, мне нравилось использовать программу capture2text OCR для захвата японского кандзи из манги и сбрасывать их на jisho.org, и мне было интересно, как я мог бы получить ту же функциональность ...
вопрос задан: 5 January 2017 03:33
0
ответов

Как установить новый языковой пакет для Tesseract на 16.04

Просто установите gscan2pdf v1.3.9, а также Tesseract. Что касается последнего, сначала он появился в нижней части моего списка Установленного программного обеспечения, но теперь он, кажется, пропал, хотя все еще работает (я думаю). ...
вопрос задан: 1 July 2016 19:37
0
ответов

Почему двигатель ocrodjvu не найден?

Я безуспешно бегу в Ubuntu 14.04 LTS, пытаясь получить лучшее OCR документа DjVU ocrodjvu - in-place document.djvu, но получить ocrodjvu: error: OCR engine (tesseract) не найден. Я выяснил ...
вопрос задан: 25 January 2016 00:17
0
ответов

Проблема с установкой OCRopus

Я работаю над проектом и должен использовать OCRopus, я пытался установить его на windows, но не смог, поэтому перешел в Ubuntu. Я не нервничаю, когда дело доходит до Ubuntu, поэтому я застрял сейчас. Я установил python ...
вопрос задан: 17 October 2015 10:11
0
ответов

Tesseract OCR Engine на ubuntu как сделать

Я установил tesseract-ocr. Я смотрел руководство, но я не вижу возможности, чтобы определить границы изображений (X, Y, W, H). Может ли кто-нибудь помочь в этом или попросить не в том месте?
вопрос задан: 18 July 2015 10:47
0
ответов

Справка по Canon CanoScan LiDE отсканировала PDF-документы

Я только начал работать с Ubuntu в течение последних 10 дней с намерением остановить использование Windows навсегда. Пока это было потрясающе. Я заменил почти все мои приложения Microsoft ...
вопрос задан: 14 June 2014 16:48
0
ответов

Это хорошая идея попытаться скомпилировать tesseract 3.02 на ubuntu 14.04?

У меня есть ubuntu 14.04 на моей записной книжке, и я собираюсь работать с tesseract, составив его для некоторых исследований в области компьютерных наук. Я нахожусь на хорошем пути? Svn tesseract обеспечивает только 3.02, так как я ...
вопрос задан: 21 May 2014 13:26
0
ответов

Альтернатива оформлению документов

Я ищу альтернативу программе Paperwork, поскольку ее довольно сложно установить под Ubuntu. Я особенно заинтересован в том, чтобы найти способ прочитать даты, цены и другие детали из ...
вопрос задан: 13 January 2014 23:06
0
ответов

Не удается выполнить сканирование с Gscan2PDF на 13.10 или OCR с помощью Tesseract

У меня проблемы с одним из моих любимых программ с открытым исходным кодом. Я установил Gscan2PDF (1.0.4) из Software Center на мой 13.10 64-битный компьютер (чистая установка из 13 ....
вопрос задан: 13 November 2013 10:21
0
ответов

Как подстановочный тессеракт?

Я хочу, чтобы tesseract конвертировал все файлы в папку. Я не хочу объединять файлы в любом случае, поскольку у меня возникают проблемы с такими программами, как hocr2pdf и pdfbeads, объединяющие более одного файла за раз. ...
вопрос задан: 30 March 2013 18:07
0
ответов

Как создать многостраничный сэндвич pdf с hocr2pdf?

Я использовал tesseract для создания специального html для использования с hocr2pdf, начиная с мути-страницы tif. Я попытался использовать hoc2pdf для создания «sandwich pdf» (изображение + скрытый текстовый слой). Hocr2pdf производит ...
вопрос задан: 23 March 2013 00:19
0
ответов

Как добавить текст OCRed в оригинальный pdf в gscan2pdf? [закрыто]

Я новичок в gscan2pdf 0.9.31 и просто использовал его для OCR сканированного pdf. После сохранения pdf текст OCRed сохраняется в верхнем левом углу. Однако я хочу, чтобы каждый символ OCRed был добавлен точно ...
вопрос задан: 10 May 2011 07:29
0
ответов

Как добавить текст OCRed к оригинальному PDF в gscan2pdf? [закрыто]

Я новичок в gscan2pdf 0.9.31, и просто использовал его для распознавания отсканированного PDF. После сохранения pdf текст OCRed сохраняется в верхнем левом углу. Однако я хочу, чтобы каждый символ OCRed был добавлен точно ...
вопрос задан: 10 May 2011 06:29