Существует множество вопросов и ответов относительно лучшего средства просмотра PDF, доступного с Ubuntu, но я хочу проанализировать файл PDF и узнать подробности PDF, такие как изображения, шрифты и ссылки, которые доступны в данном файле PDF.
Существуют ли какие-либо средства просмотра метаданных PDF / редакторы тегов?
Просмотр метаданных pdf для файла с именем Example.pdf:
pdfinfo Example.pdf
Редактирование существующих метаданных в терминале с помощью нано-редактора:
pdftk Example.pdf dump_data output Metadata-output.txt
nano Metadata-output.txt
Обновление метаданных:
pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
Сочетания клавиш Nano Editor
Используйте комбинацию клавиш Ctrl kbd> + O kbd> и после этого нажмите Enter kbd>, чтобы сохранить файл в текущем месте.
Используйте комбинацию клавиш Ctrl kbd> + X kbd> для выхода из nano.
CLI решение
Другая полезная утилита - exiftool . Преимущество exiftool перед pdfinfo состоит в том, что он поддерживает гораздо больше типов метаданных (например, теги XMP).
Вот пример команды, которая напечатает всю доступную метаинформацию (-a
), отсортированную по группам (-G1
):
exiftool -a -G1 "$File"
Обзор поддерживаемых тегов, связанных с PDF:
Вы можете установить exiftool в Ubuntu с помощью:
sudo apt-get install libimage-exiftool-perl
Решение с графическим интерфейсом
Если вы ищете средство просмотра метаданных PDF с графическим интерфейсом / редактор, вы можете попробовать PDFMtEd . Это набор графических утилит, которые я написал для управления метаданными PDF с помощью exiftool:
Ответ «лучший» действительно зависит от того, сколько деталей вы хотите и от того, насколько стабильным вы хотите, чтобы зритель был. Существует множество программ для просмотра и даже редактирования пост-скриптов и PDF-файлов в Linux; все, что, по-видимому, было удалено из текущих репозиториев Ubuntu (возможно, из-за проблем со стабильностью).
А пока я бы порекомендовал попробовать pdfedit. Если вы используете Quantal или более раннюю версию, ее можно установить через
sudo apt-get install pdfedit
. Для более новых выпусков вам необходимо скачать ее со страницы на странице проекта , распаковать и собрать самостоятельно. .
Чтобы подробнее остановиться на методе редактирования pdftk
, который хорош, потому что он показывает вам все, что устанавливается, в то же время позволяя вам изменять что угодно, вот скрипт (для вашего .bashrc
или другого файл псевдонимов), чтобы сделать это с помощью одной команды. Это создаст новую версию файла, который вы хотите отредактировать, откроет ваш любимый редактор с метаданным, а затем внесет ваши изменения и установит время создания / изменения файла в измененном PDF-файле таким же, как и в оригинале. Чтобы использовать его, выделив файл .bashrc
, просто наберите
editPDFmetadata myfile.pdf
Вот псевдоним:
editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA output $OUTPUT
touch -r ${1} ${OUTPUT}
}
Просто поместите приведенное выше определение в .bashrc
в вашей домашней папке, затем откройте новый терминал, и он будет готов к использованию.
sudo apt-get install libimage-exiftool-perl
Метаданные могут быть удалены в целом следующей командой
exiftool -all:all= file_name