Существует ли лучший способ отредактировать PDF?

Я должен был распечатать несколько PDFs недавно для отправки кому-то, но я хотел отредактировать (закрашивают черной краской) пару маленьких битов текста.

Быстрый поиск Google не поднял инструментов для этой определенной цели, таким образом, я отступил к imagemagick и калеке:

  • convert document.pdf document.png
  • gimp document-0.png
  • (используйте кисть для вымарывания текста текста),
  • распечатайте отредактированную страницу от калеки
  • печать остающиеся страницы от xpdf

Проблема с этой стратегией состоит в том, что процесс преобразования (от PDF до PNG или безотносительно другого формата) теряет качество. Я пытался редактировать PDF в калеке, но он не работал правильно далеко.

Существует ли определенный инструмент, который разрешает редакцию таким образом? (Это не должна даже быть "реальная" редакция - я не отправляю электронную копию, таким образом, "поддельная" редакция будет работать, потому что бумажная копия не может быть взломана для раскрытия базового текста.)

Или, есть ли прием к способности отредактировать PDFs в калеке?

24
задан 27 October 2011 в 23:04

15 ответов

(изначально я рекомендовал Okular, но он не работал так, как я ожидал)

1. Отредактируйте документ в векторном редакторе

Мне удалось открыть PDF-файл в Inkscape , нарисовать прямоугольник поверх фрагмента текста и распечатать его. Inkscape - векторный редактор, поэтому растеризация не требуется. Однако некоторые шрифты выглядели неправильно - возможно, потому, что документ был создан на компьютере Windows с теми шрифтами, которые отсутствуют на моем.

Обратите внимание , что любой метод, который не включает растеризацию, является приемлемым, только если вы собираетесь печатать отредактированный документ на бумаге, а не распространять его в электронном виде, так как текст все еще можно извлечь из под отключениями.

2. Увеличьте разрешение растеризации при открытии в редакторе растровых изображений

Относительно «потери качества» при открытии страницы в Gimp : вы можете напрямую открыть файл PDF в Gimp. Это будет растеризовано в процессе. Величина потери качества в процессе зависит от разрешения, которое вы выбираете при импорте - разрешение 300 т / д должно обеспечить очень приличное качество (по умолчанию 100).

Вы также можете получить хорошие результаты с помощью команды ImageMagick convert, если скажете увеличить разрешение:

convert -density 300x300 ...
0
ответ дан 27 October 2011 в 23:04

Поскольку многие решения здесь рекомендуют редактирование / отключение с помощью аннотаций (которые оставляют исходный контент в pdf), я рекомендую растеризацию pdf впоследствии, чтобы действительно удалить исходный контент. (Не будь этим парнем .)

Вот один из способов сделать это, в то же время поддерживая качество и размер файла низкими (по крайней мере, в моем случае куча черно-белых страниц):

$  convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf

Примечание: convert нужен ImageMagick.

Примечание 2: convert не сохраняет содержимое форм, которые вы могли заполнить. Чтобы он не потерялся, вы можете сначала напечатать документ «в файл» примерно в evince (или в любом приложении, которое вы заполнили), а затем , а затем растеризовать его. [ 119]

0
ответ дан 27 October 2011 в 23:04

Если вы используете LibreOffice для создания PDF-файла, откройте документ в LibreOffice, выделите текст, который нужно отредактировать, щелкните правой кнопкой мыши и выберите символ, выберите «Фон» и нажмите черный. Экспорт в PDF.

0
ответ дан 27 October 2011 в 23:04

Существует несколько редакторов для непосредственного редактирования документов PDF, таких как pdfedit, или преобразования его в другие векторные форматы, которые могут быть лучше поддержаны, например, pstoedit. Однако я бы не рекомендовал использовать какой-либо из них, так как риск сделать что-то глупое, например, просто закрасить текст черным, оставив векторы на месте, очень просто, что делает редактирование тривиальным для отмены.

Переход от вектора к растровому маршруту является наиболее безопасным способом, предпочтительно 1-разрядным растровым маршрутом, чтобы избежать любых потенциальных проблем с альфа-каналами или цветовых различий, которые могут сделать текст читабельным.

Если возможно, вы всегда должны редактировать исходный документ и просто удалять информацию, а не рисовать в PDF, поскольку даже кернинг и интервал текста вокруг отредактированного текста могут его выдать.

0
ответ дан 27 October 2011 в 23:04

Лучший способ сделать это - использовать http://www.pdfescape.com . Вы можете комментировать, добавлять текст и изображения, рисовать «белый» прямоугольник вокруг того, что вы хотите отредактировать, и вы можете быстро загрузить и сохранить его. Он также очень хорошо работает с многостраничными документами, с чем не справляются многие другие решения. Например, если вы откроете многостраничный документ в Gimp или Inkscape, вы сможете открыть только одну страницу за раз. Процесс намного быстрее в PDFescape. Для меня весь процесс редактирования двухстраничного документа занимает меньше минуты.

0
ответ дан 27 October 2011 в 23:04

Вы также можете попробовать этот инструмент: https://launchpad.net/updf

Вот оно (но в любом случае, текст можно выбрать):

enter image description here

0
ответ дан 27 October 2011 в 23:04

Если вы не хотите помнить правильное заклинание для convert, вы можете использовать pdf-redact-tools , скрипт оболочки, автоматизирующий процесс разбиения PDF на изображения PNG и объединения их обратно вместе после редактирования (используя инструмент по вашему выбору, например, GIMP). Это удобно apt-get установить .

0
ответ дан 27 October 2011 в 23:04

Откройте PDF с помощью бесплатного инструмента PDF-Xchange PDF Viewer . Вычеркните текст, который нужно отредактировать, используя черные прямоугольники. Распечатать. Это даст вам легкую, качественную «фальшивую» редакцию.

0
ответ дан 27 October 2011 в 23:04

Используйте LibreOffice Draw для того быстрого редактирования, которое вы ищете. После этого вы можете сохранить его в формате LibreOffice Draw или снова экспортировать в формат PDF (File> Export as PDF)

enter image description here

. Для импорта файлов PDF в LibreOffice Draw сначала необходимо установить пакет libreoffice-pdfimport.

Установите его через Центр программного обеспечения Ubuntu ( libreoffice-pdfimport Install libreoffice-pdfimport ) или через терминал с sudo apt-get install libreoffice-pdfimport.

0
ответ дан 27 October 2011 в 23:04

PDF Studio не является открытым исходным кодом и требует программного обеспечения.

С точки зрения этого вопроса, начиная с версии 8 он имеет функцию ручного редактирования. Пользователи могут выбрать текстовый объект и отредактировать его. Содержимое удаляется из PDF и заменяется черным прямоугольником.

В версии 9, которая выйдет в третьем квартале 2013 года, аннотации и запись для редактирования также будут доступны для изображений и фигур.

0
ответ дан 27 October 2011 в 23:04

Добавляю в список: Крита . Не было потери качества, потому что при импорте PDF вы можете определить dpi (установите значение 300, как сказал @Sergey). После редактирования нажмите «Экспорт в PDF». Наконец, я нахожу Krita более интуитивным, чем Gimp, после того, как долгое время пользовался Photoshop.

0
ответ дан 27 October 2011 в 23:04

Вы можете использовать Okular.

sudo apt-get install okular
  1. Откройте PDF с помощью Okular.
  2. Нажмите F6 .
  3. Нажмите 8 .
  4. Выделите текст, который вы хотите отредактировать.
  5. Щелкните правой кнопкой мыши текст, выберите свойства, выберите «Тип» в качестве «Выделения», нажмите Ok .
  6. Распечатать файл в формате PDF.
0
ответ дан 27 October 2011 в 23:04

Я, редактируют много файлов PDF каждый день, таким образом, я провожу много времени, думая, как сделать это лучший способ.

Для меня лучшим способом является разделение PDF в файле 1 страницы PDF, рядом с редактированием с GIMP, рядом с объединением это. Я не использую imagemagick на всех файлах (я не использую вообще), таким образом, я не делаю текстового слоя потерь на всех страницах, но только на отредактированном. Не загружайте целый файл PDF сразу, потому что он вызывает исчерпание памяти.

Разделите PDF в 1 файле подкачки

Легко разделите файлы PDF к 1 странице PDF, Вы можете этой функцией удара (поместите ее в ~/.bashrc):

function pdf_split(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
    done;
};

Можно теперь войти split_pdf file.pdf получить много файлов PDF.

Отредактируйте файлы

Но, теперь Вы должны отредактировать, все это регистрирует. Можно сделать это с gimp original-filename-*.pdf. Я предлагаю, настраивают ярлык в GIMP (Главное окно-> Редактирование-> Ярлык) для замены файла (я использую CTRL+R), фильтр размытия (например, CTRL+D), близкий файл (например, CTRL+W), и выйдите из GIMP (например, CTRL+Q). Не забудьте не делать загрузки в GIMP во многие файлы сразу, но GIMP как Вы о загрузке после открытый, таким образом, можно использовать gimp original-filename-*.pdf на тысяче безопасных файлов.

Файлы объединения

Можно объединить файлы легко с: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";

Соедините все это вместе

Эти операции являются очень повторяющимися и скучными, таким образом, я соединяю все это в 1 сценарии:

function pdf_redact(){
    for file in "$@"; do
        if [ "${file##*.}" != "pdf" ]; then
            echo "Skip $file because it's not PDF file";
            continue
        fi; 
        pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}') 
        echo "Detect $pages in $file";
        filename="${file%.*}";
        unset Outfile;
        for i in $(seq 1 "$pages"); do
            pdftk "$file" cat "$i" output "$filename-$i.pdf";
            Outfile[$i]="$filename-$i.pdf";
        done;
        gimp "${Outfile[@]}";
        pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
        rm "${Outfile[@]}";

    read -p "Do you want open output file? " -n 1 -r
    echo    
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
            evince "$filename-anon.pdf";
    fi

    read -p "Do you want upload output file to Scribd.com? " -n 1 -r
    echo 
    if [[ $REPLY =~ ^[Yy]$ ]]
    then
        scribd_up "$filename-anon.pdf";
    fi
    done;
};

Новейшая версия этого сценария всегда доступна в: http://dostep.jawne.info.pl/it/bashrc

Не забудьте закрывать GIMP (CTRL+Q) после всей редакции для продолжения сценария.

В склонности оно как я, чтобы открыть отредактированные файлы (мне нравится, когда чтение проверяет, ли все) и чтобы загрузить на Scribd с моим другим сценарием - scribd_up, поэтому теперь я могу отредактировать много файлов PDF очень эффективно.

5
ответ дан 27 October 2011 в 23:04

Я помню, как однажды мне и коллеге пришлось найти способ отредактировать пару PDF-файлов. В итоге мы использовали Gimp. Я прокомментирую вам детали ... мы открываем pdf напрямую с помощью gimp (в терминале)

gimp the_file.pdf

Как только вы закончите редактирование, мы не сохранили изменения, вместо того, чтобы распечатать их в PDF-файл ... Кажется, это работает нормально.

0
ответ дан 27 October 2011 в 23:04

По сути, вы пытаетесь выделить / аннотировать PDF, но с некоторой гибкостью в отношении прозрачности и цвета маркера (вы упомянули, что вам не нужно подвергать цензуре / удалять что-либо, просто редактировать). Посмотрите ли вы ответы здесь: Как выделить или аннотировать PDF-файлы?

Один из ответов с самым высоким рейтингом рекомендует Xournal , который здесь не упоминался и был бы моим оружием выбора. Это инструмент, который позволяет вам делать рукописные заметки, но имеет дополнительные функции, позволяющие аннотировать PDF. По умолчанию он сохраняет ваши аннотации в виде отдельного файла, но также позволяет вам экспортировать аннотированный PDF как новый PDF. Это должно поддерживать макет, шрифты и т. Д.

В Xournal вы можете выбрать «Аннотировать PDF», затем использовать сплошной черный маркер для маскировки частей, которые вы хотите отредактировать, и «Экспорт в PDF».

В Интернете есть несколько историй о том, что Xournal растеризует текст в экспортированном PDF-файле (спасибо за указание на это, MHC). Это не похоже на правду: с простыми аннотациями текст остается выбираемым и доступным для поиска, а размер файла не сильно увеличивается (в приведенном ниже примере он увеличился с 205 КБ до 220 КБ).

Для установки запустите в терминале: sudo apt-get install xournal или просто выберите его в Центре программного обеспечения

Xournal interface Resulting exported PDF

0
ответ дан 27 October 2011 в 23:04

Другие вопросы по тегам:

Похожие вопросы: