43
ответа

Добавление информации OCR в PDF-файл

У меня есть качественное сканирование документа; такое сканирование в формате pdf. Как добавить дополнительную информацию в pdf, чтобы она стала доступной для поиска? Под поиском я имею в виду, что цель заключается в том, что при просмотре ...
вопрос задан: 7 June 2012 15:19
14
ответов

Ошибка при установке GOCR

Когда я попытался установить GOCR на Ubuntu Linux 11.10, я получил следующее считывание в терминале: ??? $ cd gocr-0.48; make install ./configure для проверки gcc ... gcc для компилятора C ...
вопрос задан: 26 May 2012 15:24
14
ответов

Как извлечь текст из изображений?

Как извлечь текст из изображений? Я не говорю о отсканированных файлах, а о садовых изображениях, например, когда вы снимаете высокоуровневую фотографию доски в классе, и она красиво написана от руки; ...
вопрос задан: 31 August 2011 15:38
9
ответов

Как указать язык, который будет использоваться Tesseract при использовании OCRFeeder

Я использую OCR-утилиту OCRFeeder. OCRFeeder использует движок tesseract. Я установил несколько языковых пакетов, необходимых для tesseract. Как я могу установить язык так, чтобы tesseract ...
вопрос задан: 10 February 2011 22:44
8
ответов

Каково лучшее, самое простое решение OCR?

Я хотел бы просканировать хорошую сумму бумаг, у меня есть ложь вокруг с наименее возможной стычкой. Я хотел бы преобразовать их в изображения с помощью Простого Сканирования, затем преобразовал бы их в текст с помощью OCR. Есть ли...
вопрос задан: 22 March 2013 08:58
7
ответов

Добавление информации OCR в PDF

У меня хорошее качество сканирования документа; такое сканирование в формате PDF. Как я могу добавить информацию ocr в pdf, чтобы она стала доступной для поиска? Под поиском я имею в виду, что цель заключается в том, что при просмотре ...
вопрос задан: 7 June 2012 14:19
6
ответов

Как превратить PDF в PDF с возможностью поиска по тексту?

У меня есть несколько отсканированных документов в формате PDF, и я хочу иметь возможность искать их. Как я могу это сделать? По сути, я должен OCR PDF, а затем смешать извлеченный текст обратно в новый PDF. Я имею ...
вопрос задан: 13 April 2017 15:24
6
ответов

Как можно мгновенно извлечь текст из области экрана, используя инструменты OCR?

В Ubuntu 12.10, если я наберу gnome-screenshot -a | Выходные данные tesseract, которые он возвращает: ** Сообщение: невозможно использовать встроенный интерфейс снимков экрана GNOME Shell, прибегая к резервному X11. Как я могу выбрать ...
вопрос задан: 12 April 2013 17:58
6
ответов

Какое лучшее, самое простое решение для распознавания текста?

Я бы хотел отсканировать большое количество бумаг, которые я лежал, с наименьшими возможными хлопотами. Я хотел бы преобразовать их в образы с помощью простого сканирования, а затем преобразовать их в текст с помощью OCR. Есть ли ...
вопрос задан: 22 March 2013 21:58
6
ответов

Tesseract и OCRopus

Мне было интересно, какие отношения между Tesseract и OCRopus? Является ли OCRopus оболочкой Tesseract? Или они сейчас развиваются самостоятельно? Каковы некоторые преимущества одного над другим? Благодаря ...
вопрос задан: 31 July 2011 02:16
5
ответов

Как мне отредактировать текст в отсканированном формате .jpeg?

Мне нужно загрузить отсканированное изображение в виде документа PDF. После сканирования документа у меня есть .jpeg с небольшим текстом, который я хочу отредактировать перед преобразованием в PDF для загрузки. Я никогда не делал этого ...
вопрос задан: 10 January 2013 01:06
4
ответа

пакетное преобразование тессеракта

Я пытаюсь распознать книгу, используя tesseract, но я не хочу печатать каждую отдельную страницу, поскольку это книга объемом около 1000 страниц. Как бы это сделать, я попробовал тессеракт * .tif *, который дает мне это ...
вопрос задан: 25 March 2013 16:17
4
ответа

Как редактировать текст в сканированном .jpeg?

Мне нужно загрузить отсканированное изображение в формате PDF. После сканирования документа у меня есть .jpeg с небольшим текстом, который я хочу редактировать, прежде чем конвертировать в PDF для загрузки. Я никогда не делал этого ...
вопрос задан: 10 January 2013 03:06
3
ответа

Ошибка Ubuntu 18.04 устанавливает tesseract

Я установил Ubuntu 18.04. Я установил tesseract, использующий sudo склонный - получают tesseract-ocr установки, Когда я ввожу: tesseract-v у меня была ошибка: tesseract: ошибка поиска символа:/usr/lib/x86_64-linux-gnu/...
вопрос задан: 12 January 2019 08:26
3
ответа

Как создавать высококачественные PDF-файлы со скопированным текстом из сканирования?

Некоторые компании предоставляют программное обеспечение для Windows со своими сканерами *, которые могут создавать PDF-файлы со сканированных страниц, которые выглядят точно так же, как сканированный материал (как если бы это были только полностраничные
вопрос задан: 24 September 2017 14:16
3
ответа

Как превратить PDF в текстовый файл с возможностью поиска?

У меня есть несколько отсканированных документов в формате pdf, и я хочу, чтобы их можно было искать. Как я могу это сделать? По сути, мне нужно OCR pdf, а затем добавить извлеченный текст обратно в новый pdf. У меня есть ...
вопрос задан: 13 April 2017 15:24
3
ответа

Есть ли хороший читаемый OCR шрифт

Как часть моих резервных копий, я хотел бы смочь распечатать и более позднее пересканирование Base64-закодированная копия моего закрытого ключа. К сожалению, ни gocr, ни tesseract, кажется, не могут правильно считать любой шрифт...
вопрос задан: 10 March 2014 03:45
2
ответа

читатель gimage OCR

Я недавно установил gimage читателя OCR. Не очевидно, как использовать его. Я еще не разработал, как получить доступный для редактирования текстовый файл. Моя цель состоит в том, чтобы заставить libreoffice файл редактировать и сохранять. Спасибо...
вопрос задан: 4 November 2018 12:03
2
ответа

Как я могу заставить Tesseract OCR распознавать большие цифры счетчика электроэнергии?

Я хочу использовать программу OCR на RPi, чтобы распознавать цифры с фотографии моего счетчика электроэнергии. Цифры большие и очень очевидны для меня, но Tesseract, похоже, не может их распознать ...
вопрос задан: 7 August 2017 23:13
2
ответа

преобразование djvu к PDF беспокоится с этим кодом сохранения OCR

Я хочу преобразовать djvu в PDF при сохранении OCR. Эта страница описывает, как сделать так, но я получаю пустой файл HTML. В/home/steven/Documents/djvu2pdf/1/, djvu2hocr-p 1 Intro.djvu дает мне:...
вопрос задан: 13 April 2017 15:24
2
ответа

pdfbeads будет выводить только одну страницу

Следуя инструкциям на этой странице, я беру документ djvu, проверяю его на наличие признаков повреждения, открывая его в djvulibre, и он проверяется нормально. Скопируйте его в мою папку тестирования и переименуйте его ...
вопрос задан: 13 April 2017 15:23
2
ответа

«sh: 1: невозможно открыть /tmp/pdfsandwich4e375e.html: Нет такого файла» при использовании pdfsandwitch [закрыто]

Я попытался добавить текстовый слой к некоторым файлам pdf, чтобы сделать их доступными для поиска. Этот метод объясняется в немецкой вики Ubuntu: http://wiki.ubuntuusers.de/pdfsandwich. После установки ...
вопрос задан: 13 April 2017 15:23
2
ответа

Преобразование рукописного журнала данных в excel [закрыто]

Мне нужно ввести много рукописных данных в excel, и мне интересно, есть ли более простой способ сделать это, чем вводить все данные в excel вручную. Любые предложения?
вопрос задан: 23 May 2016 12:39
2
ответа

Почему после обновления до 14.04 в Gscan2pdf не работают движки OCR?

Я недавно обновился до Ubuntu 14.04, но OCR в gscan2pdf перестал работать. Я использую последнюю версию gscan2pdf (1.2.4) как с Tesseract, так и с Cuneiform. При загрузке PDF документов в ...
вопрос задан: 25 April 2014 04:24
2
ответа

Установите GimageReader в Kubuntu - мой последний шаг избавления от Windows

Надеюсь, у вас все хорошо. Я был без Windows в течение почти двух недель. И я даже не использую Wine, чтобы использовать программное обеспечение Windows. Сначала я установил Ubuntu, затем перешел на Kubuntu [мне нравится ...
вопрос задан: 31 March 2014 10:48
2
ответа

Оптическое распознавание символов для LibreOffice

У меня есть бумажный документ. Есть еще страницы, содержащие таблицу с 3 столбцами (текущий номер, имя и оценка). Я отсканировал его и получил 16 JPEG-документов. Каждый JPEG это отсканированная страница. Теперь мне нужно ...
вопрос задан: 3 July 2013 18:14
2
ответа

Abbyy прекрасный читатель, как приложение для Ubuntu 13.04

У меня много изображений, и я хочу отсканировать эти изображения и получить вывод в виде файла MS Word, который можно редактировать позже. Для Windows у меня есть Abbyy, отличный читатель. Но я не хочу возвращаться к ...
вопрос задан: 19 May 2013 12:03
2
ответа

Как можно мгновенно извлечь текст из области экрана с помощью инструментов OCR?

В Ubuntu 12.10, если я набираю gnome-screenshot -a | tesseract output: ** Сообщение: невозможно использовать встроенный скриншот интерфейса GNOME Shell, прибегая к резервному X11. Как я могу выбрать ...
вопрос задан: 12 April 2013 18:58
2
ответа

Как подстановить тессеракт?

Я хочу, чтобы tesseract конвертировал все файлы в папке. Я не хочу объединять файлы каким-либо образом, поскольку у меня возникают проблемы с такими программами, как hocr2pdf и pdfbeads, которые объединяют более одного файла одновременно. ...
вопрос задан: 30 March 2013 16:07
2
ответа

управление документами частных пользователей

Я ищу систему управления документами, которая поддерживает: может ли массовое сканирование документов автоматическое распознавание отсканированных данных хранения данных на моем локальном HD / внешнем сервере по моему выбору автоматического резервного коп
вопрос задан: 19 March 2013 04:15