Я хочу найти слово типа fooonetwo в одном файле PDF. Итак, дело в том, что я не знаю, что реальный приход - foo_one_two или foo.one.two или foo-one-two или foo-one_two ! или ....
Или лучше сказать, что я хочу найти слова, которые одновременно включают foo и one и два . Итак, я помню, что в базе данных у нас есть такая особенность: например, запрос для поиска слов, которые начинаются с foo , а также включают в себя один и два . Так есть ли просмотрщик PDF для этого? Какой просмотрщик PDF и как это сделать.
Вы могли использовать pdfgrep
для поиска внутренний .pdf
файлы с помощью шаблонов. Сначала необходимо установить pdfgrep
, пакет,
sudo apt-get install pdfgrep
И команда должен быть,
pdfgrep -in 'foo.one.two' file.pdf
, Dot в вышеупомянутом шаблоне будет соответствовать любому символу (Это не представляет литеральную точку). Таким образом, это найдет foo.one.two
, foo-one-two
, foo_one_two
.
Синтаксис:
pdfgrep -in pattern file.pdf