Как извлечь JPEG из PDF [dубликат]

У этого вопроса уже есть ответ: Извлечение встроенных изображений из ответов PDF 8

У меня есть изображение JPEG внутри PDF-файла, я знаю, что это JPEG, потому что, когда я открываю файл с шестнадцатеричным редактором я вижу в нем строку JFIF. Как извлечь его в отдельный файл.

В конкретном файле, который у меня есть только одно изображение, и оно находится на первой странице.

Я знаю, что можно используйте convert из пакета Image Magic, чтобы преобразовать изображение, но это будет означать, что произойдет двойное преобразование, что сделает изображение более худшим или ненужным большим размером.

1
задан 26 September 2017 в 13:24

3 ответа

Для извлечения изображения необходимо установить автоматически pdfimages.

Командная строка будет выглядеть следующим образом:

pdfimages -j file.pdf ./

Обратите внимание, что требуется косая черта , если он опущен, процесс извлечения не произойдет, и сообщение об ошибке не будет создано. Также возможно предоставить файлам стартовый префикс как ./prefix, тогда все они будут помещены в текущий каталог и начнутся с предоставленного префикса.

Невозможно ограничить pdfimages чтобы извлечь только один файл, но можно предоставить страницу, которую он будет обрабатывать, используя опции -f (первая страница) и -l (последняя страница). Все параметры должны быть предоставлены перед входным файлом.

1
ответ дан 22 May 2018 в 18:06
  • 1
    Какой вопрос задать вопрос, если вы уже знаете ответ? Это не вики-страница. – Russo 26 September 2017 в 13:27
  • 2
    @ Russo хм, это разрешено (упоминается в справочном туре), хотя ожидается, что пользователь будет ждать и дать другим возможность прийти с ответом первым – Rinzwind 26 September 2017 в 13:30
  • 3
    @Rinzwind, я это знаю. Но он поставил вопрос и ответ в то же время. – Russo 26 September 2017 в 13:31
  • 4
    @Russo на самом деле, он равен . У сайтов Stack Exchange всегда был крест между форумом, блогом и вики. Задавать и отвечать на свой вопрос - активно поощряется . – terdon♦ 26 September 2017 в 13:43
  • 5
    @Russo уверен, но никто не мешает другим отвечать! Просто один человек уже успел потратить время и попытался опубликовать свой собственный ответ. Большой! Но кто-то еще может добавить свой ответ, как и любой другой пост. – terdon♦ 26 September 2017 в 13:49

Для извлечения изображения необходимо установить автоматически pdfimages.

Командная строка будет выглядеть следующим образом:

pdfimages -j file.pdf ./

Обратите внимание, что требуется косая черта , если он опущен, процесс извлечения не произойдет, и сообщение об ошибке не будет создано. Также возможно предоставить файлам стартовый префикс как ./prefix, тогда все они будут помещены в текущий каталог и начнутся с предоставленного префикса.

Невозможно ограничить pdfimages чтобы извлечь только один файл, но можно предоставить страницу, которую он будет обрабатывать, используя опции -f (первая страница) и -l (последняя страница). Все параметры должны быть предоставлены перед входным файлом.

1
ответ дан 18 July 2018 в 06:12

Для извлечения изображения необходимо установить автоматически pdfimages.

Командная строка будет выглядеть следующим образом:

pdfimages -j file.pdf ./

Обратите внимание, что требуется косая черта , если он опущен, процесс извлечения не произойдет, и сообщение об ошибке не будет создано. Также возможно предоставить файлам стартовый префикс как ./prefix, тогда все они будут помещены в текущий каталог и начнутся с предоставленного префикса.

Невозможно ограничить pdfimages чтобы извлечь только один файл, но можно предоставить страницу, которую он будет обрабатывать, используя опции -f (первая страница) и -l (последняя страница). Все параметры должны быть предоставлены перед входным файлом.

1
ответ дан 24 July 2018 в 18:32

Другие вопросы по тегам:

Похожие вопросы: