Я стремлюсь аннотировать PDF-файлы с помощью аннотаций, хранящихся отдельно. Okular раньше делал это ... но, к сожалению, больше не .
Есть ли какие-либо альтернативы, либо тот, который хранит аннотации отдельно, либо способ разделить аннотированный PDF-файл на исходный PDF-файл и файл, содержащий аннотацию?
Xournal можно использовать для создания заметок и комментирования PDF-файлов. Аннотации сохраняются в отдельном файле .xoj
. Если исходный файл — example.pdf
, соответствующий файл Xournal называется example.pdf.xoj
.
Есть ли способ анализировать xoj-файлы?
xoj
файлы представляют собой xml-файлы, сжатые с помощью gzip. Вы можете распаковать их, переименовав их в xoj.gz
и запустив для них gzip -d
. Затем вы можете использовать для них xml или утилиты обработки текста. Например, вы можете использовать grep
для поиска заметок, которые были введены как текст.