pdftohtml, выводящие изображения с низким разрешением. Помогите?

Можно запустить программу в фоновом режиме (ваш скрипт может потребоваться некоторое изменение, если это невозможно) с помощью ...

nohup {program} > {program.out} 2>&1 & 

Выход из программы будет перенаправлен на {program. вне}. Если вы измените «>» на «>>», он добавит результат вместо записи в предыдущее время, когда он был использован.

Это устранит необходимость в терминальном сеансе. Кроме того, он также будет захватывать сообщения об ошибках, которые вы, возможно, пропустили из-за того, что сеанс терминала был убит / остановлен.

2
задан 29 March 2011 в 00:50

16 ответов

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 25 July 2018 в 22:17
  • 1
    Спасибо за ответ. Но я хочу использовать его на веб-сервере, с php-скриптом, вызывающим pdftohtml. Это легкий подход, и OpenOffice звучит неуклюже – Jake 29 March 2011 в 00:23

Я не совсем уверен, но вижу, что ваша проблема связана с этой ошибкой. http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это говорит о том, что вы делаете, даже без ошибок, представляет собой сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он главным образом предназначен для отображения и печати как есть.

Извлечение текста и изображений легко с помощью одного и того же инструмента вы упомянули без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, даст вам достаточно хорошие изображения, но макет может не то, что вы хотите, но, возможно, вы могли бы создать что-то, чтобы исправить это. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 25 July 2018 в 22:17

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 26 July 2018 в 20:24
  • 1
    Спасибо за ответ. Но я хочу использовать его на веб-сервере, с php-скриптом, вызывающим pdftohtml. Это легкий подход, и OpenOffice звучит неуклюже – Jake 29 March 2011 в 00:23

Я не совсем уверен, но вижу, что ваша проблема связана с этой ошибкой. http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это говорит о том, что вы делаете, даже без ошибок, представляет собой сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он главным образом предназначен для отображения и печати как есть.

Извлечение текста и изображений легко с помощью одного и того же инструмента вы упомянули без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, даст вам достаточно хорошие изображения, но макет может не то, что вы хотите, но, возможно, вы могли бы создать что-то, чтобы исправить это. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 26 July 2018 в 20:24

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 2 August 2018 в 03:45
  • 1
    Спасибо за ответ. Но я хочу использовать его на веб-сервере, с php-скриптом, вызывающим pdftohtml. Это легкий подход, и OpenOffice звучит неуклюже – Jake 29 March 2011 в 00:23

Я не совсем уверен, но вижу, что ваша проблема связана с этой ошибкой. http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это говорит о том, что вы делаете, даже без ошибок, представляет собой сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он главным образом предназначен для отображения и печати как есть.

Извлечение текста и изображений легко с помощью одного и того же инструмента вы упомянули без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, даст вам достаточно хорошие изображения, но макет может не то, что вы хотите, но, возможно, вы могли бы создать что-то, чтобы исправить это. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 2 August 2018 в 03:45

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 4 August 2018 в 19:49
  • 1
    Спасибо за ответ. Но я хочу использовать его на веб-сервере, с php-скриптом, вызывающим pdftohtml. Это легкий подход, и OpenOffice звучит неуклюже – Jake 29 March 2011 в 00:23

Я не совсем уверен, но вижу, что ваша проблема связана с этой ошибкой. http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это говорит о том, что вы делаете, даже без ошибок, представляет собой сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он главным образом предназначен для отображения и печати как есть.

Извлечение текста и изображений легко с помощью одного и того же инструмента вы упомянули без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, даст вам достаточно хорошие изображения, но макет может не то, что вы хотите, но, возможно, вы могли бы создать что-то, чтобы исправить это. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 4 August 2018 в 19:49

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 6 August 2018 в 03:53

Я не совсем уверен, но посмотрю, связана ли ваша проблема с этой ошибкой http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это сказало, что вы делаете даже без ошибок, чревато потенциальными выходными катастрофами, PDF - это сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он в основном предназначен для отображения и печати как есть.

Текст и изображение извлечение легко с помощью того же инструмента, о котором вы говорили, без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, приведет вас достаточно хороших изображений, но макет может быть не таким, каким вы хотите, но, возможно, вы могли бы создать что-то, чтобы его исправить. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 6 August 2018 в 03:53

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 7 August 2018 в 21:49

Я не совсем уверен, но посмотрю, связана ли ваша проблема с этой ошибкой http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это сказало, что вы делаете даже без ошибок, чревато потенциальными выходными катастрофами, PDF - это сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он в основном предназначен для отображения и печати как есть.

Текст и изображение извлечение легко с помощью того же инструмента, о котором вы говорили, без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, приведет вас достаточно хороших изображений, но макет может быть не таким, каким вы хотите, но, возможно, вы могли бы создать что-то, чтобы его исправить. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 7 August 2018 в 21:49

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 10 August 2018 в 10:03

Я не совсем уверен, но посмотрю, связана ли ваша проблема с этой ошибкой http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это сказало, что вы делаете даже без ошибок, чревато потенциальными выходными катастрофами, PDF - это сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он в основном предназначен для отображения и печати как есть.

Текст и изображение извлечение легко с помощью того же инструмента, о котором вы говорили, без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, приведет вас достаточно хороших изображений, но макет может быть не таким, каким вы хотите, но, возможно, вы могли бы создать что-то, чтобы его исправить. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 10 August 2018 в 10:03

Я не совсем уверен, но посмотрю, связана ли ваша проблема с этой ошибкой http://web.archiveorange.com/archive/v/RybTrtkbz0vNyQrK1IlX

Это сказало, что вы делаете даже без ошибок, чревато потенциальными выходными катастрофами, PDF - это сложный формат документа, который обычно не предназначен для преобразования в другие форматы, он в основном предназначен для отображения и печати как есть.

Текст и изображение извлечение легко с помощью того же инструмента, о котором вы говорили, без ключа -c, который пытается сохранить внешний вид исходного PDF,

Я бы сказал, попробуйте конвертировать без использования ключа -c, это, скорее всего, приведет вас достаточно хороших изображений, но макет может быть не таким, каким вы хотите, но, возможно, вы могли бы создать что-то, чтобы его исправить. вам может не понадобиться ничего исправить, если PDF-файл прост.

2
ответ дан 13 August 2018 в 16:23

Я не уверен, что вы можете настроить его, но вы можете попробовать использовать Openoffice с расширением pdf-import для выполнения ваших преобразований.

0
ответ дан 13 August 2018 в 16:23
  • 1
    Спасибо за ответ. Но я хочу использовать его на веб-сервере, с php-скриптом, вызывающим pdftohtml. Это легкий подход, и OpenOffice звучит неуклюже – Jake 29 March 2011 в 00:23

Другие вопросы по тегам:

Похожие вопросы: