pdfimages: одна строка в восстановленном изображении отличается от того замеченного в файле PDF

Когда я использую pdfimages для восстановления рис. 5 (p13) из этого файла, одна из струн в изображении поменялась от "Умеренного" до "Общего". Это происходит с и без флага-j (т.е. и для -004.jpg и для-004.ppm).

https://www.who.int/docs/default-source/coronaviruse/who-china-joint-mission-on-covid-19-final-report.pdf

Я могу только предположить, что исходное изображение могло бы иметь многоуровневую структуру. Восстановленное изображение, кажется, не имеет многоуровневую структуру, но я вижу их так редко, я не мог быть уверен.

0
задан 10 March 2020 в 13:06

1 ответ

Это не проблема pdfimages. pdfimages извлекает необработанное изображение из PDF. Поле, маркированное Common на странице 13 перезаписывается в редакторе PDF с Moderate издателем документа. Вы видите это при парении над Moderate поле. Курсор мыши может выбрать текст, который он не может для других полей.

Знание этого это очевидно это pdfimages извлечет Вас исходное основное изображение, которое является также, что должен сделать инструмент.

0
ответ дан 11 March 2020 в 07:28

Другие вопросы по тегам:

Похожие вопросы: