Я должен был распечатать несколько PDFs недавно для отправки кому-то, но я хотел отредактировать (закрашивают черной краской) пару маленьких битов текста.
Быстрый поиск Google не поднял инструментов для этой определенной цели, таким образом, я отступил к imagemagick и калеке:
convert document.pdf document.png
gimp document-0.png
Проблема с этой стратегией состоит в том, что процесс преобразования (от PDF до PNG или безотносительно другого формата) теряет качество. Я пытался редактировать PDF в калеке, но он не работал правильно далеко.
Существует ли определенный инструмент, который разрешает редакцию таким образом? (Это не должна даже быть "реальная" редакция - я не отправляю электронную копию, таким образом, "поддельная" редакция будет работать, потому что бумажная копия не может быть взломана для раскрытия базового текста.)
Или, есть ли прием к способности отредактировать PDFs в калеке?
(изначально я рекомендовал Okular, но он не работал так, как я ожидал)
1. Отредактируйте документ в векторном редакторе
Мне удалось открыть PDF-файл в Inkscape , нарисовать прямоугольник поверх фрагмента текста и распечатать его. Inkscape - векторный редактор, поэтому растеризация не требуется. Однако некоторые шрифты выглядели неправильно - возможно, потому, что документ был создан на компьютере Windows с теми шрифтами, которые отсутствуют на моем.
Обратите внимание , что любой метод, который не включает растеризацию, является приемлемым, только если вы собираетесь печатать отредактированный документ на бумаге, а не распространять его в электронном виде, так как текст все еще можно извлечь из под отключениями.
2. Увеличьте разрешение растеризации при открытии в редакторе растровых изображений
Относительно «потери качества» при открытии страницы в Gimp : вы можете напрямую открыть файл PDF в Gimp. Это будет растеризовано в процессе. Величина потери качества в процессе зависит от разрешения, которое вы выбираете при импорте - разрешение 300 т / д должно обеспечить очень приличное качество (по умолчанию 100).
Вы также можете получить хорошие результаты с помощью команды ImageMagick convert
, если скажете увеличить разрешение:
convert -density 300x300 ...
Поскольку многие решения здесь рекомендуют редактирование / отключение с помощью аннотаций (которые оставляют исходный контент в pdf), я рекомендую растеризацию pdf впоследствии, чтобы действительно удалить исходный контент. (Не будь этим парнем .)
Вот один из способов сделать это, в то же время поддерживая качество и размер файла низкими (по крайней мере, в моем случае куча черно-белых страниц):
$ convert -quality 100 -density 180 -compress zip notreallyredacted.pdf trulyredacted.pdf
Примечание: convert
нужен ImageMagick.
Примечание 2: convert
не сохраняет содержимое форм, которые вы могли заполнить. Чтобы он не потерялся, вы можете сначала напечатать документ «в файл» примерно в evince
(или в любом приложении, которое вы заполнили), а затем , а затем растеризовать его. [ 119]
Если вы используете LibreOffice для создания PDF-файла, откройте документ в LibreOffice, выделите текст, который нужно отредактировать, щелкните правой кнопкой мыши и выберите символ, выберите «Фон» и нажмите черный. Экспорт в PDF.
Существует несколько редакторов для непосредственного редактирования документов PDF, таких как pdfedit
, или преобразования его в другие векторные форматы, которые могут быть лучше поддержаны, например, pstoedit
. Однако я бы не рекомендовал использовать какой-либо из них, так как риск сделать что-то глупое, например, просто закрасить текст черным, оставив векторы на месте, очень просто, что делает редактирование тривиальным для отмены.
Переход от вектора к растровому маршруту является наиболее безопасным способом, предпочтительно 1-разрядным растровым маршрутом, чтобы избежать любых потенциальных проблем с альфа-каналами или цветовых различий, которые могут сделать текст читабельным.
Если возможно, вы всегда должны редактировать исходный документ и просто удалять информацию, а не рисовать в PDF, поскольку даже кернинг и интервал текста вокруг отредактированного текста могут его выдать.
Лучший способ сделать это - использовать http://www.pdfescape.com . Вы можете комментировать, добавлять текст и изображения, рисовать «белый» прямоугольник вокруг того, что вы хотите отредактировать, и вы можете быстро загрузить и сохранить его. Он также очень хорошо работает с многостраничными документами, с чем не справляются многие другие решения. Например, если вы откроете многостраничный документ в Gimp или Inkscape, вы сможете открыть только одну страницу за раз. Процесс намного быстрее в PDFescape. Для меня весь процесс редактирования двухстраничного документа занимает меньше минуты.
Вы также можете попробовать этот инструмент: https://launchpad.net/updf
Вот оно (но в любом случае, текст можно выбрать):
Если вы не хотите помнить правильное заклинание для convert
, вы можете использовать pdf-redact-tools , скрипт оболочки, автоматизирующий процесс разбиения PDF на изображения PNG и объединения их обратно вместе после редактирования (используя инструмент по вашему выбору, например, GIMP). Это удобно apt-get установить .
Откройте PDF с помощью бесплатного инструмента PDF-Xchange PDF Viewer . Вычеркните текст, который нужно отредактировать, используя черные прямоугольники. Распечатать. Это даст вам легкую, качественную «фальшивую» редакцию.
Используйте LibreOffice Draw для того быстрого редактирования, которое вы ищете. После этого вы можете сохранить его в формате LibreOffice Draw или снова экспортировать в формат PDF (File
> Export as PDF
)
. Для импорта файлов PDF в LibreOffice Draw сначала необходимо установить пакет libreoffice-pdfimport
.
Установите его через Центр программного обеспечения Ubuntu ( libreoffice-pdfimport ) или через терминал с sudo apt-get install libreoffice-pdfimport
.
PDF Studio не является открытым исходным кодом и требует программного обеспечения.
С точки зрения этого вопроса, начиная с версии 8 он имеет функцию ручного редактирования. Пользователи могут выбрать текстовый объект и отредактировать его. Содержимое удаляется из PDF и заменяется черным прямоугольником.
В версии 9, которая выйдет в третьем квартале 2013 года, аннотации и запись для редактирования также будут доступны для изображений и фигур.
Добавляю в список: Крита . Не было потери качества, потому что при импорте PDF вы можете определить dpi (установите значение 300, как сказал @Sergey). После редактирования нажмите «Экспорт в PDF». Наконец, я нахожу Krita более интуитивным, чем Gimp, после того, как долгое время пользовался Photoshop.
Вы можете использовать Okular.
sudo apt-get install okular
Я, редактируют много файлов PDF каждый день, таким образом, я провожу много времени, думая, как сделать это лучший способ.
Для меня лучшим способом является разделение PDF в файле 1 страницы PDF, рядом с редактированием с GIMP, рядом с объединением это. Я не использую imagemagick на всех файлах (я не использую вообще), таким образом, я не делаю текстового слоя потерь на всех страницах, но только на отредактированном. Не загружайте целый файл PDF сразу, потому что он вызывает исчерпание памяти.
Легко разделите файлы PDF к 1 странице PDF, Вы можете этой функцией удара (поместите ее в ~/.bashrc):
function pdf_split(){
for file in "$@"; do
if [ "${file##*.}" != "pdf" ]; then
echo "Skip $file because it's not PDF file";
continue
fi;
pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}')
echo "Detect $pages in $file";
filename="${file%.*}";
unset Outfile;
for i in $(seq 1 "$pages"); do
pdftk "$file" cat "$i" output "$filename-$i.pdf";
Outfile[$i]="$filename-$i.pdf";
done;
done;
};
Можно теперь войти split_pdf file.pdf
получить много файлов PDF.
Но, теперь Вы должны отредактировать, все это регистрирует. Можно сделать это с gimp original-filename-*.pdf
. Я предлагаю, настраивают ярлык в GIMP (Главное окно-> Редактирование-> Ярлык) для замены файла (я использую CTRL+R), фильтр размытия (например, CTRL+D), близкий файл (например, CTRL+W), и выйдите из GIMP (например, CTRL+Q). Не забудьте не делать загрузки в GIMP во многие файлы сразу, но GIMP как Вы о загрузке после открытый, таким образом, можно использовать gimp original-filename-*.pdf
на тысяче безопасных файлов.
Можно объединить файлы легко с: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";
Эти операции являются очень повторяющимися и скучными, таким образом, я соединяю все это в 1 сценарии:
function pdf_redact(){
for file in "$@"; do
if [ "${file##*.}" != "pdf" ]; then
echo "Skip $file because it's not PDF file";
continue
fi;
pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}')
echo "Detect $pages in $file";
filename="${file%.*}";
unset Outfile;
for i in $(seq 1 "$pages"); do
pdftk "$file" cat "$i" output "$filename-$i.pdf";
Outfile[$i]="$filename-$i.pdf";
done;
gimp "${Outfile[@]}";
pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
rm "${Outfile[@]}";
read -p "Do you want open output file? " -n 1 -r
echo
if [[ $REPLY =~ ^[Yy]$ ]]
then
evince "$filename-anon.pdf";
fi
read -p "Do you want upload output file to Scribd.com? " -n 1 -r
echo
if [[ $REPLY =~ ^[Yy]$ ]]
then
scribd_up "$filename-anon.pdf";
fi
done;
};
Новейшая версия этого сценария всегда доступна в: http://dostep.jawne.info.pl/it/bashrc
Не забудьте закрывать GIMP (CTRL+Q) после всей редакции для продолжения сценария.
В склонности оно как я, чтобы открыть отредактированные файлы (мне нравится, когда чтение проверяет, ли все) и чтобы загрузить на Scribd с моим другим сценарием - scribd_up, поэтому теперь я могу отредактировать много файлов PDF очень эффективно.
Я помню, как однажды мне и коллеге пришлось найти способ отредактировать пару PDF-файлов. В итоге мы использовали Gimp. Я прокомментирую вам детали ... мы открываем pdf напрямую с помощью gimp (в терминале)
gimp the_file.pdf
Как только вы закончите редактирование, мы не сохранили изменения, вместо того, чтобы распечатать их в PDF-файл ... Кажется, это работает нормально.
По сути, вы пытаетесь выделить / аннотировать PDF, но с некоторой гибкостью в отношении прозрачности и цвета маркера (вы упомянули, что вам не нужно подвергать цензуре / удалять что-либо, просто редактировать). Посмотрите ли вы ответы здесь: Как выделить или аннотировать PDF-файлы?
Один из ответов с самым высоким рейтингом рекомендует Xournal , который здесь не упоминался и был бы моим оружием выбора. Это инструмент, который позволяет вам делать рукописные заметки, но имеет дополнительные функции, позволяющие аннотировать PDF. По умолчанию он сохраняет ваши аннотации в виде отдельного файла, но также позволяет вам экспортировать аннотированный PDF как новый PDF. Это должно поддерживать макет, шрифты и т. Д.
В Xournal вы можете выбрать «Аннотировать PDF», затем использовать сплошной черный маркер для маскировки частей, которые вы хотите отредактировать, и «Экспорт в PDF».
В Интернете есть несколько историй о том, что Xournal растеризует текст в экспортированном PDF-файле (спасибо за указание на это, MHC). Это не похоже на правду: с простыми аннотациями текст остается выбираемым и доступным для поиска, а размер файла не сильно увеличивается (в приведенном ниже примере он увеличился с 205 КБ до 220 КБ).
Для установки запустите в терминале: sudo apt-get install xournal
или просто выберите его в Центре программного обеспечения