Как скопировать текст с PDF и вставить его к другому приложению, сохраняющему текстовый формат?

У меня есть файл PDF.
Я должен скопировать некоторый текст с него сохраняющий его форматирование (таким образом, я должен сохранить курсив, полужирный, _underline _, размеры шрифта и цвета, ссылки).

Кажется, что я должен скопировать текст с PDF как HTML или RTF (или что-то подобное).

Я попробовал:

  • текст копии от Atril, вставка Устройству записи LibreOffice - получила простой текст, даже если я выбираю вставку как RTF;
  • текст копии от Atril, вставка к Abiword - получила простой текст;
  • текст копии от Okular, вставки к LibreOffice или Abiword - получил простой текст;
  • преобразование PDF к HTML с pdf2htmlex - получил HTML, но копирование с веб-браузера разъясняет весь текст снова;
  • при импорте PDF к Отпечатку LibreOffice - сохраняется форматирование, но копирование является трудным из-за большой суммы текстовых блоков.

Какое программное обеспечение из Ubuntu 16.04 репозиторий LTS я должен использовать для решения моей проблемы?

0
задан 10 April 2018 в 14:11

1 ответ

Это вообще невозможно. Даже с Acrobat Reader Pro. Adobe рекомендует сохранять в формате Word или HTML. Evince или Okular позволят вам копировать и вставлять, используя средство просмотра из utf8, но это в основном отбрасывает форматирование.

Как вы сказали, лучше всего использовать импорт LibreOffice, который пытается сохранить многие функции формата PDF, которые отображаются в формате PDF. Кроме того, вы можете использовать инструмент pdftk, чтобы выбрать определенные страницы из большего файла PDF, а затем импортировать их в LibreOffice.

1
ответ дан 30 October 2019 в 02:58

Другие вопросы по тегам:

Похожие вопросы: