Я хочу преобразовать некоторые файлы HTML в единственный файл PDF.
Я использовал htmldoc
:
htmldoc --webpage --header "/" --footer "" -f all.pdf 0010.html 0099.html
Вывод all.pdf
не преобразовывает некоторые вещи хорошо. Например, математика expresseion ⌈(1.02 n)⌉
(обрисованный в общих чертах в красном поле), не шоу правильно, и некоторый маленький значок (обрисованный в общих чертах в зеленом поле) был добавлен. (См. изображение ниже.)
Существует опция --charset
для htmldoc
по http://sunsite.ualberta.ca/Documentation/Misc/htmldoc-1.8.23/htmldoc.html. Я не нахожу utf-8
. Какой может отобразить математические выражения хорошо?
Как я буду использовать htmldoc
правильно преобразовать и объединить файлы HTML в файл PDF, избежать вышеупомянутых проблем как можно больше?
Я управляю возможностью проблем, прибывающих из файлов HTML путем печати файла HTML в файл PDF в браузере Google Chrome. Это выглядит хорошо без вышеупомянутых проблем. (См. изображение ниже.)
Но мне нравится решение для командной строки, которое предпочтительно может работать как htmldoc
к structurize файлы HTML в файл PDF с опцией --book
.
Есть ли программы командной строки, подобные htmldoc
чтобы я попытался видеть, могут ли они работать без вышеупомянутых проблем?
Все мои файлы (файлы HTML и сгенерированные файлы PDF) находятся в этом архиве tar:
0010_files 0010.html 0099.html 0099_files all.pdf 0010.pdf
где all.pdf
единственный файл PDF, сгенерированный htmldoc
из двух файлов HTML, и 0010.pdf
файл PDF, сгенерированный путем открытия и печати 0010.html
в Google Chrome.
Вывод htmldoc
и мои вручную добавленные три поля выделения:
Вывод печати 0010.html
от Google Chrome:
Существует поддержка № UTF-8 html2doc. Возможно, в версии 1.9.
Вот другая опция:
Установка wkhtmltopdf
: утилиты Командной строки для преобразования HTML в PDF или изображение с помощью WebKit.
sudo apt-get install wkhtmltopdf
И установка poppler-utils
:
sudo apt-get install poppler-utils
Переходят к Вашим файлам HTML:
cd <your_html_path>
и запускают преобразование для единственных файлов с:
wkhtmltopdf 0010.html 0010.pdf
wkhtmltopdf 0099.html 0099.pdf
или для всех файлов сразу:
for f in *.html; do wkhtmltopdf "$f" "${f%%.*}.pdf"; done
Преобразовывают все единственные файлы PDF в один:
pdfunite *.pdf out.pdf
или как сценарий:
#!/bin/bash
# Convert all html files in the current folder into one pdf
#
for f in *.html; do wkhtmltopdf "$f" "${f%%.*}.pdf"; done
pdfunite *.pdf out.pdf
[еще 1119] infos и опции для wkhtmltopdf здесь .