ищите все страницы длинного PDF для строки

Я использовал команду ghostscript для объединения всех файлов PDF в каталоге в тот, который приблизительно восемьдесят страниц длиной. Когда я работаю, поиск строки с проявляют, это говорит мне количество раз, которым это было найдено только на той странице. Если я буду продолжать нажимать затем, то это возьмет меня к термину на более поздних страницах. Существует ли установка в, проявляют, какой может измениться таким образом, что это найдет каждое происшествие строки в PDF без Вас бывший должный помочь ему? В противном случае есть ли лучшее средство просмотра PDF для Linux или даже инструмент командной строки, который может сделать это (скажите мне, по крайней мере, на которых номерах страниц термин должен быть найден),

1
задан 16 April 2020 в 10:01

1 ответ

Существует по крайней мере две опции искать pdfs на командной строке:

  1. Используя инструмент pdfgrep, то, которое делает то, что это - имя, предлагает. Это совместимо с GNU grep, но работает на файлы PDF.
pdfgrep 'pattern' yourfile.pdf 
  1. Использовать pdftotext от poppler-utils (должен быть установлен по умолчанию на Рабочем столе Ubuntu), преобразуйте его в файл простого текста и используйте стандарт grep:
pdftotext yourfile.pdf - | grep 'pattern'
1
ответ дан 25 April 2020 в 10:47

Другие вопросы по тегам:

Похожие вопросы: