Когда я хочу выполнить поиск по фрагменту, например searchPart1, какой-нибудь неизвестный текст searchPart2 в текстовом файле, я использую searchPart1.*searchPart2
. Но это невозможно в любом читателе PDF, который я использую. В настоящее время я конвертирую pdf в текстовый файл и открываю его, используя less
или geany
, а затем использую регулярное выражение, доступное для него.
Существует ли программа чтения PDF-файлов с поиском по регулярному выражению, отличная от командной строки pdfgrep
pdfgrep, в repos, не является точно читателем и требует использования терминала, но это избавляет от необходимости сначала преобразовывать файл PDF в текстовый файл и затем открывать это в способном текстовом редакторе:
В дополнение к функциям, перечисленным в Синаптическом, можно искать несколько файлов и рекурсивно. Одна большая разница от постоянного клиента grep
это, pdfgrep не обеспечивает номера строки, но номера страниц. man pdfgrep
имеет детали.
Простой пример:
pdfgrep -in PATTERN FILENAME
Здесь, i
для нечувствительности к регистру и n
дает номер страницы, не номер строки.
Пример вывода похож:
Существует краткое видео YouTube, Pdfgrep - Искомый текст В Файлах PDF - Linux CLI, также.