Я регулярно - инженер-электроник и я схематика представления PDF. Часто я встречаюсь со сценарием, где я хотел бы искать схематическое компонент, например, "R1"
Проблема состоит в том, что поиск "R1" соответствует всему R [десятки] и R [сотни] на схематическом также. Таким образом, я хотел бы смочь использовать regex в своем поиске, или по крайней мере иметь более трудный контроль над поиском (например, искать только целое слово).
Кто-либо здесь нашел хороший инструмент PDF на Ubuntu, которая поддерживает эти функции?
Установка pdfgrep:
sudo apt-get install pdfgrep
И затем используют -C
опция и граничное соответствие слова:
pdfgrep -C 0 '\<WORD\>' file.pdf
или использование \b...\b
вместо \<...\>
.
Видят человек <час> pdfgrep
-C, --context NUM
Print at most NUM characters of context around each match.
, я погуглил и нашел JPedal (30-дневная пробная версия) . Загрузите и откройте его через командную строку следующей командой:
java -jar jpedal-trial.jar
Теперь нажатие Ctrl + F , введите слово, которое Вы хотите искать и проверить, "Находят, что Целые Слова Только" от значка Стрелки вниз () ищут целое слово.
Если Вы соглашаетесь с созданием индекса Ваших документов, Вы могли бы использовать Recoll, который является настоящим механизмом поиска по компьютеру. Для снимков экрана и инструкций по установке смотрите на этот ответ .
поиски Recoll создаются с помощью мощный язык запросов , который поддерживает подстановочные знаки и модификаторы (например, близость и слабый ).
, Например, запрос "R1"l
только привел бы к результатам целого слова. Это вызвано тем, что l
модификатор выключает стемминг. (В этом определенном примере Вам даже не был бы нужен модификатор, потому что Recoll не разворачивает последовательности чисел по умолчанию).
Если проблема состоит в том, чтобы только ограничить поиск целыми словами, который достаточно легок. Просто добавьте пробелы прежде и после Вашей строки поиска, как так: " R1 "
. Я использую этот прием в, Проявляют все время.