У меня есть изображение JPEG внутри файла PDF, я знаю, что это JPEG, потому что когда я открываю файл в шестнадцатеричном редакторе, я вижу в нем строку JFIF
. Как мне распаковать его в отдельный файл.
В конкретном файле, который у меня есть, есть только одно изображение, и оно находится на первой странице.
Я знаю, что можно использовать convert
из пакета Image Magic для преобразования изображения, но это будет означать, что произойдет двойное преобразование, что, возможно, сделает изображение либо худшего качества, либо излишне большего размера. .
Для извлечения изображения, каждому нужно автоматически установленный pdfimages
.
командная строка посмотрит следующим образом:
pdfimages -j file.pdf ./
Обратите внимание на то, что наклонная черта необходима, если она будет опущена затем, то процесса извлечения не произойдет, и никакое сообщение об ошибке не будет сгенерировано. Также возможно дать файлам стартовый префикс как ./prefix
затем, все они будут размещены в текущий каталог и запустятся с обеспеченного префикса.
не возможно ограничить pdfimages
, чтобы только извлечь единственный файл, но возможно обеспечить страницу, которую это обработает при помощи -f
(первая страница) и -l
(последняя страница) опции. Все возможности должны быть предоставлены перед входным файлом.