У меня есть документ LibreOffice, который я конвертировал в PDF в какой-то момент времени, используя встроенные возможности. Временная метка в PDF позже, чем в текстовом документе, так что это имеет смысл, но я не совсем уверен, что текстовый документ создает именно этот PDF. Документ имеет длину 20 страниц, поэтому не рекомендуется проверять его вручную.
Одна из возможностей состоит в том, чтобы переделать PDF в другую папку, а затем выполнить двоичный анализ двух PDF-файлов. К сожалению, командная строка diff
указывает, что «двоичные файлы отличаются».
Существует ли «умный двоичный дифференциал», который поможет мне определить, есть ли разница только в метаданных или какая-то такая несущественная разница?
В общем, это хорошая идея, чтобы проверить, является ли команда + расширение файла тем, что вы ищете. diff + pdf приводит к diffpdf .
sudo apt-get install diffpdf
DiffPDF используется для сравнения двух файлов PDF. По умолчанию сравнение выполняется для текста на каждой паре страниц, но сравнение внешнего вида страниц также поддерживается (например, если диаграмма изменена или переформатирован абзац). Также возможно сравнить отдельные страницы или диапазоны страниц. Например, если существует две версии файла PDF, одна со страницами 1-12, а другая со страницами 1-13 из-за добавления дополнительной страницы как страницы 4, их можно сравнить, указав два диапазона страниц: 1 -12 для первого и 1-3, 5-13 для второго. Это заставит DiffPDF сравнивать страницы в парах (1, 1), (2, 2), (3, 3), (4, 5), (5, 6) и т. Д. С (12, 13).
blockquote>
Источник: Ubuntugeek.com .