Как индексировать документ PDF?

Я читаю документ в формате PDF в Ubuntu 11.04 с помощью "Средства просмотра документов" по умолчанию. Документ составляет больше чем 500 страниц, и он требует времени для завершения, "Находят..." для конкретного текста. Существует ли способ индексировать документы в формате PDF на вышеупомянутой платформе? Я ищу функциональность, встроенную в самого читателя.

11
задан 8 September 2011 в 07:18

3 ответа

Я не уверен, что любой из читателей PDF поддерживает текстовую индексацию - вероятно, потому что индексация себя была бы довольно дорогой и файлы PDF, открытые и закрытые 'для данного случая'

Однако я сделал некоторое тестирование и вижу, что окуляр - средство просмотра по умолчанию от KDE - имеет намного более быстрый поиск, чем проявляют (средство просмотра по умолчанию из Ubuntu). Т.е. требуется, возможно, секунда для окуляра для сканирования целого документа на 500 страниц, в то время как проявляют, проводит ~5 секунд на ту же задачу.

Можно установить его путем ввода

sudo apt-get install okular 

(или просто ищите его в Центре программного обеспечения),

если бы это - первая программа KDE на Вашей машине, она потребовала бы установки довольно мало зависимостей, но это может определенно стоить того - я нахожу программы KDE обычно более способными затем их дубликаты Gnome... Okular поддерживает аннотации PDF, например, который иногда также полезен.

1
ответ дан 23 November 2019 в 04:10

Средство отслеживания может индексировать Ваши документы PDF. Это очень быстро и надежно.

Если Вы еще не используете этот большой инструмент, можно настроить его, чтобы только индексировать документы PDF: Alt+F2 затем вставляют tracker-preferences перейдите к "Местоположениям" и выберите папку своего PDF.

3
ответ дан 23 November 2019 в 04:10

Чередуйте средство просмотра PDF


Обзор

Очень легкая и быстрая альтернатива Okular, который не идет ни с одной из его зависимостей KDE, является qpdfview. Это все еще в бета-версии, но я нашел, что это было так же стабильно как его большие дубликаты. Поисковая производительность является фантастической и по крайней мере наравне с Okular.

Установка

Qpdfview ist, еще не доступный в официальных репозиториях, но, может быть легко установлен от PPA разработчика путем ввода:

sudo add-apt-repository ppa:b-eltzner/qpdfview && apt-get update
sudo apt-get install qpdfview

Индексация PDF


Обзор

Я не смог найти альтернативу возможностям индексации Adobe Acrobat на Linux, и кажется поэтому, что встроенные индексы все еще не являются частью, открывают стандарты PDF.

Однако существует много очень мощных механизмов поиска по компьютеру там, которые и быстрее и более эффективны в индексации PDF, чем собственные инструменты Adobe. Средство отслеживания уже было упомянуто, но существуют другие приложения там также. Можно найти очень полное сравнение здесь.

1
ответ дан 23 November 2019 в 04:10

Другие вопросы по тегам:

Похожие вопросы: