Regex поиск PDF?

Я регулярно - инженер-электроник и я схематика представления PDF. Часто я встречаюсь со сценарием, где я хотел бы искать схематическое компонент, например, "R1"

Проблема состоит в том, что поиск "R1" соответствует всему R [десятки] и R [сотни] на схематическом также. Таким образом, я хотел бы смочь использовать regex в своем поиске, или по крайней мере иметь более трудный контроль над поиском (например, искать только целое слово).

Кто-либо здесь нашел хороший инструмент PDF на Ubuntu, которая поддерживает эти функции?

3
задан 8 January 2015 в 03:54

3 ответа

Установка pdfgrep:

sudo apt-get install pdfgrep

И затем используют -C опция и граничное соответствие слова:

pdfgrep -C 0 '\<WORD\>' file.pdf

или использование \b...\b вместо \<...\>.

Видят человек <час> pdfgrep

-C, --context NUM
      Print at most NUM characters of context around each match.

, я погуглил и нашел JPedal (30-дневная пробная версия) . Загрузите и откройте его через командную строку следующей командой:

java -jar jpedal-trial.jar

Теперь нажатие Ctrl + F , введите слово, которое Вы хотите искать и проверить, "Находят, что Целые Слова Только" от значка Стрелки вниз (enter image description here) ищут целое слово.

enter image description here

3
ответ дан 17 November 2019 в 09:42

Если Вы соглашаетесь с созданием индекса Ваших документов, Вы могли бы использовать Recoll, который является настоящим механизмом поиска по компьютеру. Для снимков экрана и инструкций по установке смотрите на этот ответ .

поиски Recoll создаются с помощью мощный язык запросов , который поддерживает подстановочные знаки и модификаторы (например, близость и слабый ).

, Например, запрос "R1"l только привел бы к результатам целого слова. Это вызвано тем, что l модификатор выключает стемминг. (В этом определенном примере Вам даже не был бы нужен модификатор, потому что Recoll не разворачивает последовательности чисел по умолчанию).

2
ответ дан 17 November 2019 в 09:42

Если проблема состоит в том, чтобы только ограничить поиск целыми словами, который достаточно легок. Просто добавьте пробелы прежде и после Вашей строки поиска, как так: " R1 ". Я использую этот прием в, Проявляют все время.

1
ответ дан 17 November 2019 в 09:42

Другие вопросы по тегам:

Похожие вопросы: