Я установил gocr с помощью команды, предложенной терминалом ubuntu (sudo apt install gocr), чтобы выполнить распознавание текста в pdf-файле с помощью OCR. Как я мог это использовать? Я не нашел для этого учебника.
В более новых версиях Ubuntu он был заменен на tesseract-ocr: https://wiki.ubuntuusers.de/tesseract-ocr/
Для простого использования с графическим интерфейсом я рекомендую используя gImageReader: https://github.com/manisandro/gImageReader/releases
установка:
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-eng