Есть некоторые сайты, которые предоставляют книги в виде HTML-страниц (например, юридические материалы).
Что я могу использовать для создания книги PDF на этих страницах, основываясь на уже существующей структуре?
В Windows есть Adobe Professional (коммерческое программное обеспечение). Я предполагаю, что в Linux есть что-то бесплатное? Решение с использованием сценариев будет в порядке для меня.
Калибр - довольно мощный инструмент для преобразования вещей в электронные книги в различных форматах. Доступен в ближайшем к вам Центре программного обеспечения!
Не обманывайтесь его не слишком красивым пользовательским интерфейсом, он может многое.
В google-chrome вы можете создать PDF-файл для всего сайта, используя расширение. Я лично использую расширение Web2PDF Converter , которое делает PDF одним кликом.
Вот снимок экрана этого плагина, предоставленный сайтом расширений Google.
Кроме того, вы можете просмотреть PDF-файл, созданный мной с помощью этого инструмента, загрузив следующую (правый клик, сохранить цель как): http: // geppettvs .servehttp.com / resources / askubuntu-com.pdf (некоторые браузеры, такие как google-chrome, могут позволять вам видеть это в Интернете).
И если вы хотите отредактировать PDF-файлы, созданные расширением, чтобы удалить цифровую подпись, размещенную расширением в нижней части каждой страницы, или удалить что-либо еще, взгляните на это: Удалить текстовую информацию из PDF?
Удачи!
В зависимости от HTML-документа, который будет напечатан, вы можете получить наилучшие результаты, используя pandoc . Это один из самых универсальных конвертеров HTML-LaTeX. Полученный файл .tex можно легко превратить в PDF , используя xelatex
или pdflatex
. Множество вариантов доступно, если вы хотите углубиться в синтаксис и пакеты LaTeX. Это может не сработать, если встроенные изображения и причудливые стили HTML должны быть сохранены.
Я на самом деле голосовал за решение для калибра. Но вот другой, Вы могли попробовать. Установка AbiWord. Это может сделать преобразования между любыми форматами, которые это знает из командной строки. Для преобразования всех .html файлов в папке к .pdf, Вы могли сделать:
for file in *.html ; do abiword --to=pdf "$file" ; done
Для высокоуровневой типографии (но возможно более сложный), другой опцией был бы PrinceXML.
Самый простой способ? Файл> Печать из вашего браузера. Выберите Печать в файл в качестве принтера, и он спросит вас, где вы хотите. Обязательно отметьте PDF. Нажмите «Печать», и он будет фактически сохранен на вашем диске вместо фактической печати.
Вы можете попробовать http://www.xhtml2pdf.com/ . Это конвертер для HTML / XHTML и CSS в PDF. Все написано на Python.
Я бы порекомендовал использовать OpenOffice / LibreOffice для создания PDF. В качестве теста я загрузил Wget manul (все на одной странице), а затем открыл HTML-страницу в OponOffice и нажал кнопку «Экспорт напрямую в PDF». Он создал PDF с указателем из оглавления.
В прошлом я обнаружил, что это самый простой способ конвертировать HTML-страницы в PDF. Это также позволяет вносить изменения без особых усилий.
Снимки экрана:
Htmldoc может быть полезен, посмотрите здесь; http://www.htmldoc.org/ он доступен в центре программного обеспечения, к сожалению, версия 1.8 имеет проблему с файлами в кодировке Unicode, но во многих случаях она все еще может быть спасителем, проблема устранена в версия для разработки 1.9.
Я обычно использую замечательное расширение альбома для вырезок; http://amb.vis.ne.jp/mozilla/scrapbook/ для Firefox для захвата веб-страниц, используйте инструменты редактирования в записках, чтобы исправить их, если это необходимо, а затем используйте htmldoc для преобразования все страницы в PDF.