Как удалить изображения из файла PDF

Вы почти наверняка преобразовали свой диск из GPT в MBR, но способ Windows делает это, оставляя данные GPT на диске, и это путает libparted, который установщик Ubuntu использует для разбиения. Самое простое решение - запустить мою утилиту FixParts; он обнаружит блуждающие данные GPT и предложит его удалить. Скажите ему сделать это, а затем выйдите из FixParts. Вам нужно будет загрузить и использовать версию FixParts для Windows, вручную установить пакет FixParts в «попробуйте, прежде чем использовать» загрузку Ubuntu, или запустить FixParts с аварийного диска, такого как Parted Magic.

1
задан 23 February 2018 в 23:01

3 ответа

Последние версии Ghostscript тоже могут это сделать. Просто добавьте параметр -dFILTERIMAGE к вашей команде.

Еще два новых параметра, которые могут быть добавлены для выборочного удаления типов контента «вектор» и «текст»:

[d4 ] -dFILTERIMAGE: выводит результат, когда все растровые изображения удаляются. -dFILTERTEXT: выводит вывод, где все текстовые элементы удаляются. -dFILTERVECTOR: выводит вывод, где все векторные чертежи удалены.

Любые две из этих опций могут быть объединены. (Если вы объедините все 3, вы получите все страницы, которые будут запущены ...)

Примеры

Вот скриншот из примера страницы PDF, который содержит все 3 типа контента упомянутый выше:

Снимок экрана с оригинальной страницы PDF, содержащей элементы «изображения», «вектор» и «текст».

Выполнение следующих 6 команд создаст все 6 возможных вариантов оставшегося содержимого:

gs -o noIMG.pdf -sDEVICE=pdfwrite -dFILTERIMAGE input.pdf gs -o noTXT.pdf -sDEVICE=pdfwrite -dFILTERTEXT input.pdf gs -o noVCT.pdf -sDEVICE=pdfwrite -dFILTERVECTOR input.pdf gs -o onlyIMG.pdf -sDEVICE=pdfwrite -dFILTERVECTOR -dFILTERTEXT input.pdf gs -o onlyTXT.pdf -sDEVICE=pdfwrite -dFILTERVECTOR -dFILTERIMAGE input.pdf gs -o onlyVCT.pdf -sDEVICE=pdfwrite -dFILTERIMAGE -dFILTERTEXT input.pdf

На следующем рисунке показаны результаты:

Снимок экрана с оригинальной страницей PDF, содержащей элементы «изображения», «вектор» и «текст».

9
ответ дан 24 May 2018 в 06:55

В то время как ответ @Rinzwind - это правильная вещь, я хотел бы просто прокомментировать решение «посередине». Обычно вы можете значительно уменьшить размер изображений с помощью ghostscript с помощью

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen \
   -dNOPAUSE -dQUIET -dBATCH -sOutputFile=small.pdf original.pdf

... это действительно полезно для корректуры. Страница руководства для записи PDF - Right Thing .

1
ответ дан 24 May 2018 в 06:55
  • 1
    @KurtPfeifle /screen будет (среди прочего) устанавливать разрешение растрового изображения (s) на 72dpi. Так что да, если у вас есть изображения с меньшим количеством DPI, он может увеличить размер файла. Именно по этой причине я использовал слово «нормально». (в смысле «не всегда, но довольно часто»). Не стесняйтесь делать все, что хотите. – Rmano 16 June 2016 в 19:55
  • 2
    Запустите эту команду: for s in screen default ; do gs -o /dev/null -sDEVICE=pdfwrite -dPDFSETTINGS=/${s} -c "currentpagedevice {exch ==only ( ) print === } forall" | sort | tee ghostscript---pdfwrite-PDFSETTINGS-${s}--pagedevice-settings.txt; done. Он будет создавать два текстовых файла, которые можно сравнить с помощью sdiff -sbB $[file1}.txt ${file2}.txt. Теперь вы знаете точно и полностью все различные настройки, введенные -dPDFSETTINGS=/screen! – Kurt Pfeifle 16 June 2016 в 20:18
  • 3
    Готово. Все еще не видно, какой вариант может дать больший файл в /screen, чем в /default --- 72dpi против 150dpi, оптимизирован, отменить предварительный просмотр EPS ... но эй, не большая проблема. Люди будут проверять и выбирать лучшее решение. – Rmano 16 June 2016 в 20:41
  • 4
    Простите, может быть, я должен извиниться сейчас за нахальство моего первого заявления. Честно говоря, я просто , кажется, помню из моих предыдущих исследований (несколько лет назад), что /screen дал очень плохие результаты. Возможно, моя память терпит неудачу, или я перепутал ее с /epub. Команда, которую я вам дал, была из памяти, потому что я был уверен, что это покажет, что я имел в виду. Теперь я снова запустил его, я больше не вижу ожидаемого: более расширенные тесты, которые я запускал несколько лет назад. Затем множество шрифтов (CID? / CFF?) Получили растрированные размеры раздувания результирующих PDF-файлов. Я должен снова посетить этот вопрос, как только у меня будет больше времени ... :-) – Kurt Pfeifle 16 June 2016 в 21:38

Вы можете использовать главный редактор pdf, удалить эти изображения и сохранить в виде нового pdf-файла. Вы можете загрузить его из программного центра Ubuntu.

0
ответ дан 24 May 2018 в 06:55
  • 1
    Я просто установил его, чтобы попытаться, но я не вижу автоматического способа сделать это. Учитывая, что это документ на 500 страниц, я не рассматриваю удаление вручную как решение здесь. Я что-то пропустил ? – Ornux 6 June 2014 в 19:32
  • 2
    нет, вы ничего не пропустили, я думал, что изображения большого размера, поэтому вы хотите их удалить, никогда не думали о стольких изображениях. в любом случае хороший вопрос. – Sudheer 7 June 2014 в 08:32

Другие вопросы по тегам:

Похожие вопросы: