На этот вопрос уже есть ответ здесь:
У меня есть каталог pdf, который был предоставлен мне клиентом в формате pdf. У них нет изображений, но они находятся в pdf.
Есть ли способ извлечь все изображения из PDF-файла с помощью инструмента командной строки с сохранением исходных имен файлов?
Я просмотрел эту тему ( Извлекать изображения из PDF с помощью слоев-масок), но это для отдельных изображений.
Программа pdfimages
из пакета poppler-utils
может быть тем, что вы ищете. Со страницы руководства:
Pdfimages считывает PDF-файл PDF-файла, сканирует одну или несколько страниц и записывает один файл PPM, PBM или JPEG для каждого изображения.
blockquote>В более новых версиях poppler-utils есть переключатель
all
для извлечения в jpg или png:pdfimages -all input.pdf images/prefix
выведет файлы в виде [ 115] prefix-nnn. [Png | jpg] в папке изображений .