Я использую следующую команду libreoffice для преобразования моих файлов pdf в word (doc)
lowriter --headless --infilter='writer_pdf_import' --convert-to doc:"MS Word 2007 XML" sample.pdf
После преобразования выходной документ имеет каждую строку, окаймленную прямоугольной рамкой. Но если я использую ту же команду с MS Word 97 , она работает отлично.
lowriter --headless --infilter='writer_pdf_import' --convert-to doc:"MS Word 97" sample.pdf
Я не знаю, в чем заключается ошибка в первой команде. Пожалуйста, помогите мне с этим. А также предложите мне добавить другие атрибуты, которые улучшат эффективность и качество конверсии.
Согласно этому сообщению: Можно ли преобразовать файл PDF в файл Word? - Спросите у LibreOffice
Нет, LibreOffice не будет преобразовывать PDF в DOC (или ODT) или около того.
Если в вашем pdf есть тексты, а не изображения, вы можете открыть его с помощью LibreOffice draw, а затем скопировать, вставить и отредактировать и сохраните документ, как вам нужно.
Вы пытались использовать soffice
?
soffice --infilter="writer_pdf_import" --convert-to docx sample.pdf
Я давно пользуюсь LibreOffice, но до сих пор не могу понять, как он работает с разными файлами.
Я использую приведенную ниже команду для преобразования PDF в WORD. Вы можете попробовать :
libreoffice --infilter="writer_pdf_import" --convert-to docx input.pdf
Это работает отлично.