Проблема с диакритическими знаками при использовании ImageMagick или Ghostscript для преобразования PDF для Обработки изображений

У меня есть проблема при преобразовании PDF в использование Изображений ImageMagick или Ghostscript. Все символы с диакритикой исчезают из преобразованного изображения. Я нашел несколько человек, имеющих ту же проблему и по-видимому обновляющих imagemagick пакет, и ghostcript зафиксировал его, но не для меня.

Я использую этот файл PDF на каждом тесты, которые я сделал: https://www.dropbox.com/s/3gso0sw1e1n8f9r/error-with-accents.pdf? dl=0

У меня есть сервер LTS Ubuntu 14.04.2 на Azure, где мне нужен ImageMagick для работы. Из официальных репозиториев у меня есть ImageMagick 6.7.7 и Ghostscript 9.10. Позже, я пытался обновить их для устранения моей проблемы, и теперь у меня есть также работа ImageMagick 6.8.9-10 /opt/imagemagick-6.8 папка и я добавили репозиторий Ubuntu 15.04, таким образом, я мог установить Ghostscript 9.15 непосредственно через Кв. - добираются. Ни один из них не решил проблему для меня.

Вот мои попытки latests на сервере Ubuntu 14.04:

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 14.04.2 LTS
Release:    14.04
Codename:   trusty

$ /opt/imagemagick-6.8/bin/convert -version
Version: ImageMagick 6.8.9-10 Q16 x86_64 2015-07-30 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2014 ImageMagick Studio LLC
Features: DPC OpenMP
Delegates: jng jpeg png x xml zlib

$ /opt/imagemagick-6.8/bin/convert -list configure |grep DELEGATES
DELEGATES      mpeg jng jpeg png ps x xml zlib

$ /opt/imagemagick-6.8/bin/convert error-with-accents.pdf -verbose -alpha off -resample 150 -density 150 -quality '80' im-test.jpg
   **** Warning: considering '0000000000 XXXXX n' as a free entry.

   **** This file had errors that were repaired or ignored.
   **** The file was produced by: 
   **** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
   **** Please notify the author of the software that produced this
   **** file that it does not conform to Adobe's published PDF
   **** specification.

error-with-accents.pdf=>im-test.jpg PDF 595x794=>1240x1654 1240x1654+0+0 16-bit sRGB 172KB 0.440u 0:00.240

$ gs -v
GPL Ghostscript 9.15 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc.  All rights reserved.

$ gs -dBATCH -dNOPAUSE -sDEVICE=jpeg -sOutputFile=gs-test.jpg error-with-accents.pdf 
GPL Ghostscript 9.15 (2014-09-22)
Copyright (C) 2014 Artifex Software, Inc.  All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
   **** Warning: considering '0000000000 XXXXX n' as a free entry.
Processing pages 1 through 1.
Page 1

   **** This file had errors that were repaired or ignored.
   **** The file was produced by: 
   **** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
   **** Please notify the author of the software that produced this
   **** file that it does not conform to Adobe's published PDF
   **** specification.

$ convert -version
Version: ImageMagick 6.7.7-10 2014-03-06 Q16 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2012 ImageMagick Studio LLC
Features: OpenMP    

$ convert -list configure |grep DELEGATES
DELEGATES     bzlib djvu fftw fontconfig freetype jbig jpeg jng jp2 lcms2 lqr lzma openexr pango png rsvg tiff x11 xml wmf zlib

$ convert error-with-accents.pdf -verbose -alpha off -resample 150 -density 150 -quality '80' im-test-6.7.7.jpg
   **** Warning: considering '0000000000 XXXXX n' as a free entry.

   **** This file had errors that were repaired or ignored.
   **** The file was produced by: 
   **** >>>> Mac OS X 10.10.4 Quartz PDFContext <<<<
   **** Please notify the author of the software that produced this
   **** file that it does not conform to Adobe's published PDF
   **** specification.

error-with-accents.pdf=>im-test-6.7.7.jpg PDF 595x794=>1240x1654 1240x1654+0+0 16-bit DirectClass 160KB 0.490u 0:00.279

Все с теми же результатами:
https://www.dropbox.com/s/eob6y234x37s864/gs-test.jpg? dl=0
https://www.dropbox.com/s/96z1pkksdn1dpr4/im-test.jpg? dl=0
https://www.dropbox.com/s/dev0kbza2c8v2gf/im-test-6.7.7.jpg? dl=0

Я могу выполнить Ghostscript и ImageMagick правильно на Mac OS. И, согласно этому сообщению, должны работать версии, которые я имею на Ubuntu. Таким образом, я думаю, что это - что-то связанное со шрифтами FreeType. Который я ничего не знаю о том, как зафиксировать это. Какая-либо справка?

1
задан 30 July 2015 в 22:07

2 ответа

Благодаря Kurt Pfeifle на Stackoverflow для ответа.

проблемой была версия Ghostscript, установленного на сервере. Начиная с последней версии для Ghostscript на Ubuntu коварный репозиторий 9.15, я загрузил чиновника двоичный пакет для linux x64 в веб-сайте Ghostscript.

Затем я занял место /usr/bin/gs двоичный файл с одной внутренней частью пакет, и все работало правильно. Больше никаких проблем с диакритическими знаками.

1
ответ дан 7 December 2019 в 13:55

Я имел к тому же виду проблем, пытаясь напечатать PDF с акцентами. Я пришел к выводу, что это была ghostscript проблема, так как CUPS использовала его в то время как rasterising PDF до gstoraster фильтр. Я также понял, что недавний набор из двух предметов ghostscript в автономном способе делал отличную работу.

, НО я не советовал бы к subsitute /usr/bin/gs, потому что он мог сломать некоторые зависимости (КУБКИ, например)!

Вместо этого я предлагаю, чтобы Вы взглянули на инструмент pdfimages от poppler-utils

1
ответ дан 7 December 2019 в 13:55

Другие вопросы по тегам:

Похожие вопросы: