Я хотел бы получить текст заметок для отдельных слайдов в PPT в легкодоступном формате на моем компьютере с Linux (Ubuntu 12.04).
Моя цель - преобразовать слайды PPT в файлы изображений с метаданными, примечаниями в качестве мета.
Я сделал до преобразования PPT в изображения с помощью unoconv & amp; команды конвертирования,
изначально я конвертировал PPT в PDF с помощью следующей команды:
sudo unoconv -f pdf -o output.pdf input.pptx
Во-вторых, конвертировал эти PDF-файлы в PNG-файлы с помощью следующей команды конвертирования,
convert output.pdf -density 400 -quality 100 -sharpen 0x1.0 output_%01d.png
Теперь мне нужно извлечь из него заметки,
Я попытался преобразовать PPT в xhtml, чтобы получить заметки, используя следующую команду unoconv,
sudo unoconv -f xhtml -o output.xhtml input.pptx
Но в приведенном выше, можно читать заметки, но нет способа проанализировать его по коду, это не в надлежащей структуре.
Может ли кто-нибудь помочь мне извлечь из него заметки?
Заранее спасибо.