Есть ли лучший способ изменить PDF?

Мне пришлось сначала напечатать пару PDF-файлов, чтобы отправить кому-то, но я хотел отредактировать (вычеркнуть) пару небольших фрагментов текста.

Быстрый поиск в Google не показывал никаких инструменты для этой конкретной цели, поэтому я вернулся к imagemagick & amp; gimp:

  • convert document.pdf document.png
  • gimp document-0.png
  • (используйте кисть для вывода текста)
  • print redacted page из gimp
  • печатать оставшиеся страницы из xpdf

Проблема с этой стратегией заключается в том, что процесс преобразования (от PDF до PNG или любого другого формата) теряет качество. Я попытался редактировать PDF-файл в gimp, но это не сработало.

Есть ли специальный инструмент, который разрешает редакцию таким образом? (Это даже не должно быть «реальной» редакцией - я не отправляю softcopy, поэтому «фальшивая» редакция будет работать, потому что печатная копия не может быть взломана, чтобы выявить основной текст.)

Или, есть ли уловка для редактирования PDF-файлов в gimp?

17
задан 28 October 2011 в 00:04

15 ответов

(первоначально я рекомендовал Okular, но он не работал так, как я ожидал)

1. Редактировать документ в векторном редакторе

Мне удалось открыть PDF-файл в 1. Измените документ в векторном редакторе , нарисуйте прямоугольник над текстом и распечатайте его. Inkscape - это векторный редактор, поэтому никакой растеризации не требуется. Некоторые шрифты выглядели неправильно - возможно, потому, что документ был создан на компьютере Windows со шрифтами, отсутствующими на моем.

Обратите внимание, что любой метод, не связанный с растеризацией, является приемлемым только в том случае, если вы собираетесь распечатать отредактированный документ на бумаге и не распространять его в электронном виде, поскольку текст по-прежнему можно извлечь из-под отключений.

Примечание

Что касается «потери качества» при открытии страницы в Gimp: вы можете напрямую открыть PDF-файл в Gimp. Он будет растрирован в процессе. Объем потери качества в процессе - это вопрос разрешения, которое вы выбираете при импорте - 300 dpi должно дать вам очень приличное качество (по умолчанию 100).

Вы также можете получить хорошие результаты с помощью команды ImageMagick convert, если вы сообщите ей об увеличении разрешения:

convert -density 300x300 ...
13
ответ дан 25 May 2018 в 17:31
  • 1
    +1 и принято! Спасибо за предложение inkscape, он сделал разумную работу (не идеально - он потерял несколько (неважных мне) графических объектов) - но очень разумно). И наконечник на convert тоже хорош: заклинание, которое я использовал, было convert -density 300x300, и нет никакой потери качества. – bstpierre 28 October 2011 в 04:37
  • 2
    +1 для упоминания GIMP вполне может обрабатывать pdf-файлы – don.joey 20 December 2012 в 18:09
  • 3
    Предупреждение для общего населения: методы редактирования здесь, которые включают в себя сохраненный текст, предлагаемый здесь (например, все те, которые избегают растеризации), являются не безопасными. Текст по-прежнему можно выбрать из-под отключений или прочитать из источника файла. См. Например, freerepublic.com/focus/f-news/2706743/posts и hackaday.com/2008/08/01/exposing-poorly-redacted-pdfs – naught101 12 June 2013 в 07:43
  • 4
    Хотя первоначальный вопрос был задан только для отправки только на бумажном носителе, для которого приемлемы методы неосновения, downvoting, поскольку этот ответ недостаточно ясно предупреждает об угрозе безопасности при распространении результата в электронном виде. – Jesse Glick 3 February 2014 в 22:45
  • 5
    @JesseGlick: вместо "наказания" я не рассматривал вариант использования, даже не упомянутый в исходном вопросе, вы могли бы просто отредактировать ответ. Это было бы более выгодно для будущих посетителей. – Sergey 4 February 2014 в 02:29

В основном то, что вы пытаетесь сделать, это выделить / аннотировать PDF, но с некоторой гибкостью в отношении непрозрачности и цвета маркера (вы упомянули, что вам не нужно подвергать цензуре / удалению что-то, просто отредактировать). Вы посмотрели ответы здесь: Как я могу выделить или комментировать PDF-файлы?

Один из самых высоко оцененных ответов рекомендует Xournal, о котором здесь не упоминалось, и было бы моим оружием выбора. Это инструмент, который позволяет делать рукописные заметки, но имеет дополнительные функции, позволяющие вам аннотировать PDF-файл. По умолчанию он сохранит ваши аннотации в виде отдельного файла, но также позволит вам экспортировать аннотированный PDF-документ в виде нового PDF-файла. Это должно поддерживать макет, шрифты и т. Д.

С помощью Xournal вы можете выбрать «Аннотировать PDF», затем использовать сплошной черный маркер для маскировки частей, которые вы хотите отредактировать, и «Экспорт в PDF».

В Интернете есть несколько историй о том, что Xournal растеризует текст в экспортированном PDF (спасибо, что указали это, MHC). Это не похоже на правду: с помощью простых аннотаций текст остается доступным для выбора и поиска, а размер файла не увеличивается значительно (он увеличился с 205 кб до 220 кб в примере ниже).

To установить, запустить в терминале: sudo apt-get install xournal или просто выбрать его из Software Center

8
ответ дан 25 May 2018 в 17:31
  • 1
    Xournal хорош, но вы должны знать, что он может экспортировать только растровые PDF-файлы, что означает, что вся текстовая и векторная информация теряется в процессе. Если вы справитесь с этим, тогда ваш журнал станет вашим заявлением. – Glutanimate 20 April 2013 в 08:45
  • 2
    Спасибо за отзывы, @MHC. Xournal делает не растеризовать, см. Пересмотренный ответ для получения дополнительной информации. – Tomas 21 April 2013 в 08:02
  • 3
    Я просто попробовал это для себя, и ты совершенно прав. Извините за путаницу. Прошло некоторое время с тех пор, как я использовал Xournal, и почему-то у меня сложилось впечатление, что экспортированные документы не являются подлинными PDF-файлами. Спасибо, что установили это прямо! – Glutanimate 21 April 2013 в 21:13
  • 4
    Это хорошо работает, но я не смог найти чистый способ изменить информацию. Я должен был использовать инструмент рисования для рисования, который выглядит очень грязным и не хватает профессионализма, который я бы хотел. В противном случае, укажите с экспортом, растеризуя контент, чтобы он не мог быть выбран и обнаружен. – flickerfly 27 June 2016 в 18:50

Я ежедневно обрабатываю много файлов PDF, поэтому я трачу много времени на размышления, как сделать это наилучшим образом.

Для меня лучшим способом является разделение PDF в одностраничном PDF-файле, рядом с которым можно редактировать с помощью GIMP, рядом с ним. Я не использую imagemagick для всех файлов (я вообще не использую), поэтому я не потеряю текстовый слой на всех страницах, но только на redacted. Не загружайте весь файл PDF сразу, потому что он вызывает изнурение памяти.

Сплит PDF в одностраничных файлах

Легко разделять PDF-файлы на 1-страничный PDF вы можете этим bash function (поместить его в ~ / .bashrc):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

Теперь вы можете ввести split_pdf file.pdf, чтобы получить много файлов PDF.

Редактировать файлы

Но теперь вам нужно отредактировать все эти файлы. Вы можете сделать это с помощью gimp original-filename-*.pdf. Я предлагаю настроить ярлык в GIMP (Главное окно-> Редактировать-> Ярлык) для замены файла (я использую CTRL + R), фильтр размытия (например, CTRL + D), закрыть файл (например, CTRL + W) и выйти из GIMP ( eg.CTRL + Q). Не забудьте не загружать в GIMP ко многим файлам одновременно, но GIMP, как вы о загрузке после открытия, так что вы можете использовать gimp original-filename-*.pdf для тысяч файлов в безопасности.

Объединить файлы

Вы можете легко комбинировать файлы с помощью: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Соединить все это вместе

Эти операции очень повторяются и скучно, поэтому я соединяю все это в 1 скрипте:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

Новейшая версия этого скрипта всегда доступна по адресу: http://dostep.jawne.info.pl/it/bashrc[!d11 ]

Не забудьте закрыть GIMP (CTRL + Q) после всех изменений, чтобы продолжить сценарий.

В зависимости от меня, как я открываю отредактированные файлы (мне нравится читать, чтобы проверить, все ли) и как загрузить Scribd с моим другим скриптом - http://dostep.jawne.info.pl/it/bashrc , поэтому теперь я могу очень эффективно редактировать много файлов PDF.

5
ответ дан 25 May 2018 в 17:31

Вы можете использовать Okular.

sudo apt-get install okular
Откройте pdf с помощью Okular. Нажмите F6. Нажмите 8. Выделите текст, который вы хотите отредактировать. Щелкните правой кнопкой мыши текст, выберите свойства, выберите «Тип» как «Выделить», нажмите «ОК». Распечатайте файл в формате pdf.
3
ответ дан 25 May 2018 в 17:31
  • 1
    Возможно, укажите, как сделать выделение черным. – equaeghe 25 October 2016 в 11:52
  • 2
    Okular может редактировать любой цвет (черный) этих функций: выделение текста, свободная линия руки и многоугольные ссылки с внутренней заливкой. Вы можете сохранить этот параметр как свой собственный инструмент аннотации. Легко использовать его снова и снова. Затем, когда вы печатаете файл в формате pdf, вы должны «принудительно растеризировать». чтобы гарантировать, что редактирование не является обратимым. Окулярная версия 1.1.3 – shadowbq 23 March 2018 в 06:09

Откройте PDF с помощью бесплатного инструмента PDF-Xchange PDF Viewer. Вычеркните текст, который нужно отредактировать, используя черные прямоугольники. Распечатать. Это даст вам легкую, качественную «фальшивую» редакцию.

2
ответ дан 25 May 2018 в 17:31
  • 1
    Это похоже на инструмент win32. Дайте мне знать, если я пропустил ссылку на порт linux ... – bstpierre 28 October 2011 в 01:47
  • 2
    Бесплатный портативный просмотрщик PDF-Xchange будет работать с вином. – Sabacon 28 October 2011 в 04:27
  • 3
    Спасибо, это отлично сработало для меня с вином. Решения inkscape и gimp действительно полезны только для одностраничных редакций. – Gearoid Murphy 10 November 2012 в 21:52

Вы также можете попробовать этот инструмент: https://launchpad.net/updf

Вот он (но в любом случае текст можно выбрать):

2
ответ дан 25 May 2018 в 17:31
  • 1
    uPDF отлично справляется с тем, что он сохраняет исходный PDF-файл и его текст и контент svg. Однако, похоже, у него есть некоторые проблемы с уровнями сжатия. Отредактированные PDF-файлы размером примерно в 3-4 раза больше оригинала. Спасибо, что опубликовали это. Я не знал о uPDF. – Glutanimate 20 April 2013 в 09:39
  • 2
    Да, я знаю, что у него есть некоторые проблемы, это немного грубо. Надеюсь, новые выпуски исправит эти проблемы ... :) – franzlorenzon 21 April 2013 в 21:37
  • 3
    Как уже упоминалось, в uPDF есть много ошибок (и даже не отменить / повторить), но в моем случае все пошло хорошо, так что спасибо! – balu 28 January 2016 в 11:47

Я помню, как однажды мне и коллеге пришлось найти способ редактировать пару PDF-файлов, мы закончили использовать Gimp. Я прокомментирую вам подробности ... мы открываем pdf напрямую с помощью gimp (в терминале)

gimp the_file.pdf

По завершении редактирования мы не сохранили изменения, вместо этого мы печатаем в в файл pdf ... Казалось, что все нормально.

2
ответ дан 25 May 2018 в 17:31
  • 1
    По какой-то причине gimp отказывается разрешить мне вносить какие-либо изменения в файл. Сначала мне пришлось преобразовать с помощью fmf imagemagick, а затем отредактировать преобразованный файл. (См. Принятый ответ.) – bstpierre 28 October 2011 в 04:38
  • 2
    ok, решение inkscape действительно. Но я повторяю вам. Gimp может напрямую редактировать pdf-файлы. = D – maniat1k 28 October 2011 в 16:55
  • 3
    Похоже, что Gimp работает с большинством PDF-файлов, но файл, который я использовал прошлой ночью, работал неправильно. Inkscape правильно обработал этот файл. – bstpierre 28 October 2011 в 18:18

PDF Studio не является открытым исходным кодом и является программным обеспечением, которое требует покупки.

С точки зрения этого вопроса, начиная с версии 8, он имеет функцию ручного редактирования. Пользователи могут выбрать текстовый объект и отредактировать его. Содержимое удаляется из PDF и заменяется черным прямоугольником.

В версии 9, приходящей на третью четверть 2013 года, аннотации и записи комментариев будут доступны также для изображений и фигур.

2
ответ дан 25 May 2018 в 17:31
  • 1
    В соответствии с faq , вы должны раскрыть свою принадлежность к продукту, который вы рекламируете. – bstpierre 20 April 2013 в 07:14
  • 2
    Несмотря на то, что это скорее рекламное объявление, чем ответ, я должен сказать, что PDFstudio действительно является отличным программным обеспечением. Это может быть немного завышенным, но это, безусловно, лучший набор для редактирования PDF для Linux. Обязательно попробуйте их пробную версию . – Glutanimate 20 April 2013 в 08:57

Используйте LibreOffice Draw для быстрого редактирования, которое вы ищете. После того, как вы закончите, вы можете сохранить его как формат LibreOffice Draw или экспортировать его снова в формат PDF (File> Export as PDF)

Чтобы иметь возможность импортировать файлы PDF в в LibreOffice Draw вы должны сначала установить пакет libreoffice-pdfimport.

Установить его через программный центр Ubuntu (libreoffice-pdfimport) или через терминал с sudo apt-get install libreoffice-pdfimport.

1
ответ дан 25 May 2018 в 17:31

Лучшим способом, который я нашел для этого, является использование http://www.pdfescape.com. Вы можете добавлять комментарии, добавлять текст и изображения, рисовать прямоугольник «whiteout» вокруг материала, который хотите отредактировать, и вы можете быстро загрузить и сохранить его. Он также отлично работает с многостраничными документами, что является чем-то большим, чем многие другие решения не очень хорошо работают. Например, если вы открываете многостраничный документ в Gimp или Inkscape, вы сможете открывать только одну страницу за раз. Процесс намного быстрее в PDFescape. Весь процесс для редактирования двухстраничного документа занимает менее минуты.

1
ответ дан 25 May 2018 в 17:31

Как много решений здесь рекомендуют отредактировать / очернить аннотации (которые оставляют исходное содержимое в pdf), я рекомендую впоследствии растрировать PDF, чтобы действительно удалить исходное содержимое.

Вот один из способов для этого, в то же время, сохраняя качество вверх и размер файла низким (по крайней мере, в моем случае из группы черно-белых страниц):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Примечание: convert требуется ImageMagick.

Примечание 2: convert не сохраняет содержимое форм, которые вы, возможно, заполнили. Чтобы он не потерялся, вы можете сначала напечатать документ «в файл» примерно как evince (или в любом приложении, которое вы заполнили форму), а затем растрировать его.

1
ответ дан 25 May 2018 в 17:31

Существует несколько редакторов для прямого редактирования PDF-документов, таких как pdfedit, или конвертировать его в другие векторные форматы, которые могут быть лучше поддерживаются, например pstoedit. Однако я бы не рекомендовал использовать их как риск сделать что-то глупое, например, просто рисовать над текстом черным, оставив векторы на месте - это легко сделать, что делает триктным уничтожение.

Переход по вектору в растровый маршрут является самым безопасным способом, предпочтительно 1-битным растровым маршрутом, чтобы избежать возможных проблем с альфа-каналами или различиями цвета, которые могли бы оставить текст доступным для чтения.

Если возможно, вы всегда должны отредактируйте исходный документ и просто удалите информацию, а не краску в формате PDF, так как даже кернинг и интервал текста вокруг отредактированного текста могут отдать его.

0
ответ дан 25 May 2018 в 17:31
  • 1
    Я понимаю проблемы с правильным отредактированием, но благодарю вас за то, что вы обратили внимание на всех, кто приходит после этого. В моем случае сам PDF-файл является одноразовым - все, что я ищу, является печатной копией. (PDF будет удален, как только у меня будет печатная версия.) FWIW, pdfedit не сработал: когда я нарисовал черный прямоугольник над рассматриваемым текстом, он обнажил остальную часть страницы, оставив мне документ состоящий из одного черного прямоугольника. – bstpierre 28 October 2011 в 04:24

Если вы не хотите запоминать правильное заклинание для convert, вы можете использовать pdf-redact-tools, сценарий оболочки, автоматизирующий процесс взрыва PDF-файла в изображения PNG и слияние их обратно после редактирования (с использованием инструмент по вашему выбору, например, gimp). Это непринужденно apt-install installable.

0
ответ дан 25 May 2018 в 17:31

Я добавляю в список: Крита. Не было потери качества, потому что при импорте PDF вы можете определить dpi (установите его на 300, как сказал @Sergey). После редактирования нажмите «Экспорт в формате PDF». Наконец, я нахожу, что Krita более интуитивно понятен, чем Gimp, после долгого времени пользователя Photoshop.

0
ответ дан 25 May 2018 в 17:31

Если вы используете LibreOffice для создания PDF-файла, откройте doc в LibreOffice, выделите текст, который нужно отредактировать, щелкните правой кнопкой мыши и выберите символ, выберите «Фон» и нажмите «Черный». Экспорт в PDF.

-1
ответ дан 25 May 2018 в 17:31

Другие вопросы по тегам:

Похожие вопросы: