Помощь по сканированию Canon CanoScan LiDE PDF-документов

Question 1

Я только начал работать с Ubuntu в течение последних 10 дней с намерением прекратить использовать Windows навсегда. Пока это было потрясающе. Я заменил почти все свои приложения Microsoft доступными приложениями Ubuntu и некоторой помощью из Документов Google.

У меня проблема с моим сканером Canon CanoScan LiDE 110. Когда я использую сканер в Windows 7 и сохраняю отсканированные страницы книги в формате PDF, я могу открыть отсканированную страницу PDF и скопировать текст с нее непосредственно, чтобы вставить ее в Документы Google или любой документ LibreOffice. Я попытался сделать то же самое в Ubuntu с помощью приложения Simple Scan . Я отсканировал страницу как текст в Simple Scan и сохранил ее в формате PDF. Однако в Ubuntu, когда я открываю отсканированную страницу PDF, она открывается нормально, но я не могу скопировать тексты.

Это очень важно для моего рабочего процесса, так как я врач, и мне нужно изучить много книг.

Буду очень признателен, если вы поможете мне с этим.

Question 2

Tesseract OCR

Tesseract был одним из лучших 3 OCR в 1995. Разработка теперь обрабатывается Google с 2006. Это может отсканировать изображения, преобразовать в текст и распознать 40 языков.

Для установки <час> Tesseract

sudo apt-get install tesseract-ocr

Клинообразный знак

Клинообразным знаком является другая Система оптического распознавания. Это распознает 23 языка, которые включают английский, немецкий, русский, французский язык и т.д.

Для установки Клинообразного знака

sudo apt-get install cuneiform

<час>

Другие приложения что, возможно, полезный

студия Ocradjvu
Ocrad
gocr
ocrfeeder
pdf 8 серий

Registered User · Answer 1 · 14 June 2014 в 15:48