Лучший и самый простой способ использовать pypdfocr, он не меняет формат pdf. pypdfocr - это ссылка на модуль python здесь.
pypdfocr your_document.pdf
В конце вы получите еще один your_document_ocr.pdf способ, которым вы хотите его с помощью текста с возможностью поиска. Приложение не меняет качество изображения. Увеличивает размер файла, добавляя текст наложения.
Я думаю, что команда довольно проста, что ей не нужен какой-либо графический интерфейс. Возможно, установка pypdfocr немного более подробно:
sudo apt install tesseract-ocr
pip install pypdfocr