Я хочу найти определенный текст или слово из файла PDF и заменить его другим текстом и сделать новый файл PDF из командной строки. Я попробовал sed
, find
, awk
ряд на текстовых файлах, но я хочу войти в файл PDF. Какая утилита командной строки поможет мне?
Используйте pdftk
для распаковки файла, затем отредактируйте через sed
и наконец повторно сожмите его.
pdftk input.pdf output uncompressed.pdf uncompress
sed -i 's/foo/bar/g' uncompressed.pdf
# uncompressed.pdf now has all the changes
pdftk uncompressed.pdf output changed.pdf compress
, Конечно, любой текст в изображениях не может быть изменениями как это.
Возможное решение могло быть похожим на это...
можно преобразовать файлы PDF в чистые текстовые файлы при помощи нескольких инструментов от пакет poppler-utils .
Это может быть установлено через:
sudo apt-get install poppler-utils
Преобразовывают файл PDF в текстовый файл
pdftotext /home/USER/Desktop/test.pdf /home/USER/Desktop/test.txt
Теперь, Вы можете сделать редактирование и замену на Вашем файле PDF.
После этого можно преобразовать его назад при помощи пакета, названного PDF чашек ИЛИ text2pdf.
Мог бы быть не идеальное решение, но должно сделать его работу.
Hope это помогает!