Я использовал tesseract для создания специального html для использования с hocr2pdf, начиная с мути-страницы tif.
Я попытался использовать hoc2pdf для создания «сэндвич-pdf» (изображение + скрытый текстовый слой). [ ! d1]
Hocr2pdf создает одностраничную PDF-версию со всеми наложенными страницами.
Есть ли способ решить эту проблему или альтернативное решение?