Какой лучший просмотрщик метаданных PDF для Ubuntu?

В Ubuntu есть много вопросов и ответов, касающихся лучшего просмотра PDF-файлов. Но я хочу проанализировать PDF-файл и узнать подробности PDF, такие как изображения, шрифты и ссылки, которые доступны в данном PDF-файле.

Доступны ли файлы просмотра метаданных PDF?

1
задан 1 September 2014 в 03:39

3 ответа

Решение CLI

Еще одна полезная задача, которую стоит изучить, - exiftool. Преимущество exiftool заключается в том, что он поддерживает намного больше типов метаданных (например, теги XMP).

Вот пример команды, которая будет печатать всю доступную метаинформацию (-a), отсортированную по группам (-G1):

exiftool -a -G1 "$File"

Обзор поддерживаемых тегов, связанных с PDF:

PDF-теги Теги XMP PDF теги XMP dc

Вы можете установить exixool на Ubuntu с:

sudo apt-get install libimage-exiftool-perl

Решение CLI

Если вы ищете просмотрщик / редактор метаданных в формате GUI PDF вы можете дать exiftool попытку. Это набор графических утилит, которые я написал для управления метаданными PDF с помощью exiftool:

enter image description here

8
ответ дан 24 May 2018 в 13:18

Ответ «наилучшего» действительно зависит от того, сколько деталей вам нужно, и от того, насколько стабильным вы хотите видеть зрителя. Существует много программ для просмотра и даже редактирования пост-скриптов и файлов PDF в Linux; все, которые, похоже, были удалены из существующих репозиториев Ubuntu (вероятно, из-за проблем с стабильностью).

На данный момент я бы рекомендовал попробовать pdfedit. Если вы используете Quantal или ранее, его можно установить с помощью

sudo apt-get install pdfedit

. Для более новых версий вам нужно будет загрузить его со страницы проекта, распаковать его и скомпилировать.

1
ответ дан 24 May 2018 в 13:18
  • 1
    Я не хочу зрителя. Мне нужен парсер, который может извлекать данные из файла pdf, такие как ссылки, доступные в файле .... изображения доступны ... индекс файла и т. Д. – Sahil Grover 7 January 2014 в 11:04
  • 2
    Извините, pdftk запутался с pdfedit, потому что они удалили pdfedit из репозиториев – virtualxtc 7 January 2014 в 11:28

Разработать метод редактирования pdftk, который хорош, потому что он показывает вам все, что задается, в то же время, позволяя вам изменять все, что вам нравится, вот сценарий (для вашего .bashrc или другого aliases file), чтобы сделать это с помощью одной команды. Это создает новую версию файла, который вы хотите отредактировать, открывает ваш любимый редактор с помощью файла метаданных, а затем реализует ваши изменения и устанавливает время создания / изменения файла в модифицированном PDF-файле так же, как и оригинал. Чтобы использовать его, после ресурса вашего файла .bashrc просто введите

editPDFmetadata myfile.pdf

Вот псевдоним:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

Просто разместите определение выше в файл .bashrc в вашей домашней папке, затем откройте новый терминал и он будет готов к использованию.

0
ответ дан 24 May 2018 в 13:18

Другие вопросы по тегам:

Похожие вопросы: