Кодирование проблем с htmldoc и подобных программ к htmldoc?

Я хочу преобразовать некоторые файлы HTML в единственный файл PDF.

  1. Я использовал htmldoc:

    htmldoc --webpage --header "/" --footer "" -f all.pdf   0010.html 0099.html
    

    Вывод all.pdf не преобразовывает некоторые вещи хорошо. Например, математика expresseion ⌈(1.02 n)⌉ (обрисованный в общих чертах в красном поле), не шоу правильно, и некоторый маленький значок (обрисованный в общих чертах в зеленом поле) был добавлен. (См. изображение ниже.)

    Существует опция --charset для htmldoc по http://sunsite.ualberta.ca/Documentation/Misc/htmldoc-1.8.23/htmldoc.html. Я не нахожу utf-8. Какой может отобразить математические выражения хорошо?

    Как я буду использовать htmldoc правильно преобразовать и объединить файлы HTML в файл PDF, избежать вышеупомянутых проблем как можно больше?

  2. Я управляю возможностью проблем, прибывающих из файлов HTML путем печати файла HTML в файл PDF в браузере Google Chrome. Это выглядит хорошо без вышеупомянутых проблем. (См. изображение ниже.)

    Но мне нравится решение для командной строки, которое предпочтительно может работать как htmldoc к structurize файлы HTML в файл PDF с опцией --book.

    Есть ли программы командной строки, подобные htmldoc чтобы я попытался видеть, могут ли они работать без вышеупомянутых проблем?

Все мои файлы (файлы HTML и сгенерированные файлы PDF) находятся в этом архиве tar:

0010_files 0010.html 0099.html 0099_files  all.pdf 0010.pdf    

где all.pdf единственный файл PDF, сгенерированный htmldoc из двух файлов HTML, и 0010.pdf файл PDF, сгенерированный путем открытия и печати 0010.html в Google Chrome.

Вывод htmldoc и мои вручную добавленные три поля выделения:

enter image description here

Вывод печати 0010.html от Google Chrome:

enter image description here

1
задан 5 May 2015 в 13:01

1 ответ

Существует поддержка № UTF-8 html2doc. Возможно, в версии 1.9.

Вот другая опция:

Установка wkhtmltopdf: утилиты Командной строки для преобразования HTML в PDF или изображение с помощью WebKit.

sudo apt-get install wkhtmltopdf

И установка poppler-utils:

sudo apt-get install poppler-utils

Переходят к Вашим файлам HTML:

cd <your_html_path>

и запускают преобразование для единственных файлов с:

wkhtmltopdf 0010.html 0010.pdf
wkhtmltopdf 0099.html 0099.pdf

или для всех файлов сразу:

for f in *.html; do wkhtmltopdf "$f" "${f%%.*}.pdf"; done

Преобразовывают все единственные файлы PDF в один:

pdfunite *.pdf out.pdf

или как сценарий:

#!/bin/bash
# Convert all html files in the current folder into one pdf
#
for f in *.html; do wkhtmltopdf "$f" "${f%%.*}.pdf"; done
pdfunite *.pdf out.pdf
[еще 1119] infos и опции для wkhtmltopdf здесь .

1
ответ дан 11 November 2019 в 02:19

Другие вопросы по тегам:

Похожие вопросы: