Я только начал работать с Ubuntu в течение последних 10 дней с намерением прекратить использовать Windows навсегда. Пока это было потрясающе. Я заменил почти все свои приложения Microsoft доступными приложениями Ubuntu и некоторой помощью из Документов Google.
У меня проблема с моим сканером Canon CanoScan LiDE 110. Когда я использую сканер в Windows 7 и сохраняю отсканированные страницы книги в формате PDF, я могу открыть отсканированную страницу PDF и скопировать текст с нее непосредственно, чтобы вставить ее в Документы Google или любой документ LibreOffice. Я попытался сделать то же самое в Ubuntu с помощью приложения Simple Scan . Я отсканировал страницу как текст в Simple Scan и сохранил ее в формате PDF. Однако в Ubuntu, когда я открываю отсканированную страницу PDF, она открывается нормально, но я не могу скопировать тексты.
Это очень важно для моего рабочего процесса, так как я врач, и мне нужно изучить много книг.
Буду очень признателен, если вы поможете мне с этим.
Tesseract OCR
Tesseract был одним из лучших 3 OCR в 1995. Разработка теперь обрабатывается Google с 2006. Это может отсканировать изображения, преобразовать в текст и распознать 40 языков.
Для установки <час> Tesseract
sudo apt-get install tesseract-ocr
Клинообразный знак
Клинообразным знаком является другая Система оптического распознавания. Это распознает 23 языка, которые включают английский, немецкий, русский, французский язык и т.д.
Для установки Клинообразного знака
sudo apt-get install cuneiform
<час> Другие приложения что, возможно, полезный