Создать PDF из HTML книги

Есть некоторые сайты, которые предоставляют книги в виде HTML-страниц (например, юридические материалы).

Что я могу использовать для создания книги PDF на этих страницах, основываясь на уже существующей структуре?

В Windows есть Adobe Professional (коммерческое программное обеспечение). Я предполагаю, что в Linux есть что-то бесплатное? Решение с использованием сценариев будет в порядке для меня.

16
задан 31 January 2011 в 18:15

8 ответов

Калибр - довольно мощный инструмент для преобразования вещей в электронные книги в различных форматах. Доступен в ближайшем к вам Центре программного обеспечения!

Не обманывайтесь его не слишком красивым пользовательским интерфейсом, он может многое.

0
ответ дан 31 January 2011 в 18:15

В google-chrome вы можете создать PDF-файл для всего сайта, используя расширение. Я лично использую расширение Web2PDF Converter , которое делает PDF одним кликом.

Вот снимок экрана этого плагина, предоставленный сайтом расширений Google.

enter image description here

Кроме того, вы можете просмотреть PDF-файл, созданный мной с помощью этого инструмента, загрузив следующую (правый клик, сохранить цель как): http: // geppettvs .servehttp.com / resources / askubuntu-com.pdf (некоторые браузеры, такие как google-chrome, могут позволять вам видеть это в Интернете).

И если вы хотите отредактировать PDF-файлы, созданные расширением, чтобы удалить цифровую подпись, размещенную расширением в нижней части каждой страницы, или удалить что-либо еще, взгляните на это: Удалить текстовую информацию из PDF?

Удачи!

0
ответ дан 31 January 2011 в 18:15

В зависимости от HTML-документа, который будет напечатан, вы можете получить наилучшие результаты, используя pandoc . Это один из самых универсальных конвертеров HTML-LaTeX. Полученный файл .tex можно легко превратить в PDF , используя xelatex или pdflatex. Множество вариантов доступно, если вы хотите углубиться в синтаксис и пакеты LaTeX. Это может не сработать, если встроенные изображения и причудливые стили HTML должны быть сохранены.

0
ответ дан 31 January 2011 в 18:15

Я на самом деле голосовал за решение для калибра. Но вот другой, Вы могли попробовать. Установка AbiWord. Это может сделать преобразования между любыми форматами, которые это знает из командной строки. Для преобразования всех .html файлов в папке к .pdf, Вы могли сделать:

for file in *.html ; do abiword --to=pdf "$file" ; done

Для высокоуровневой типографии (но возможно более сложный), другой опцией был бы PrinceXML.

2
ответ дан 31 January 2011 в 18:15

Самый простой способ? Файл> Печать из вашего браузера. Выберите Печать в файл в качестве принтера, и он спросит вас, где вы хотите. Обязательно отметьте PDF. Нажмите «Печать», и он будет фактически сохранен на вашем диске вместо фактической печати. ​​

0
ответ дан 31 January 2011 в 18:15

Вы можете попробовать http://www.xhtml2pdf.com/ . Это конвертер для HTML / XHTML и CSS в PDF. Все написано на Python.

0
ответ дан 31 January 2011 в 18:15

Я бы порекомендовал использовать OpenOffice / LibreOffice для создания PDF. В качестве теста я загрузил Wget manul (все на одной странице), а затем открыл HTML-страницу в OponOffice и нажал кнопку «Экспорт напрямую в PDF». Он создал PDF с указателем из оглавления.

В прошлом я обнаружил, что это самый простой способ конвертировать HTML-страницы в PDF. Это также позволяет вносить изменения без особых усилий.

Снимки экрана:

  • Руководство Wget экспортировано в PDF с помощью Open Office Wget manual exported to PDF using Open Office

  • Экспорт Прямо в PDF вариант в Open Office Export Directly to PDF option in Open Office

0
ответ дан 31 January 2011 в 18:15

Htmldoc может быть полезен, посмотрите здесь; http://www.htmldoc.org/ он доступен в центре программного обеспечения, к сожалению, версия 1.8 имеет проблему с файлами в кодировке Unicode, но во многих случаях она все еще может быть спасителем, проблема устранена в версия для разработки 1.9.

Я обычно использую замечательное расширение альбома для вырезок; http://amb.vis.ne.jp/mozilla/scrapbook/ для Firefox для захвата веб-страниц, используйте инструменты редактирования в записках, чтобы исправить их, если это необходимо, а затем используйте htmldoc для преобразования все страницы в PDF.

0
ответ дан 31 January 2011 в 18:15

Другие вопросы по тегам:

Похожие вопросы: