Когда я использую pdfimages для восстановления рис. 5 (p13) из этого файла, одна из струн в изображении поменялась от "Умеренного" до "Общего". Это происходит с и без флага-j (т.е. и для -004.jpg и для-004.ppm).
https://www.who.int/docs/default-source/coronaviruse/who-china-joint-mission-on-covid-19-final-report.pdf
Я могу только предположить, что исходное изображение могло бы иметь многоуровневую структуру. Восстановленное изображение, кажется, не имеет многоуровневую структуру, но я вижу их так редко, я не мог быть уверен.
Это не проблема pdfimages
. pdfimages
извлекает необработанное изображение из PDF. Поле, маркированное Common
на странице 13 перезаписывается в редакторе PDF с Moderate
издателем документа. Вы видите это при парении над Moderate
поле. Курсор мыши может выбрать текст, который он не может для других полей.
Знание этого это очевидно это pdfimages
извлечет Вас исходное основное изображение, которое является также, что должен сделать инструмент.