Как поклонник open source (и автоматизации), я ненавижу это говорить, но лучшие результаты, которые я только что получил (в довольно большом, сложном PDF), должны были открыть его в Adobe Reader, а затем выбрать «Файл | Сохранить как текст» .
(Я предварительно обрабатываю эксперименты по анализу текста, а не как читатель, но я думаю, что мой первый и второй выбор был бы таким же.)
Я сравнивал выход бок о бок. Мой второй выбор - ebook-convert.
Adobe: слева в FF для разрывов страниц, оставшихся на страницах страниц, не преобразовывает заголовки / абзацы в отдельные строки, но имеет фиксированные дефисы. Junk, который был скрыт в PDF, не получил выход. Правильно получили большие капиталы в начале разделов, например. «The», а не «T he» или даже «T he».
ebook-convert: Оставленный на страницах страниц и некоторый скрытый мусор в верхнем и нижнем колонтитуле (но без FF). Преобразует большинство абзацев в одну строку. Однако те, что он пропустил, имеют двойное расстояние! Пули не всегда совпадают с текстом. Правильно получилось «The» в начале главы.
pdftotext (без -layout): неплохо, выпущены маркеры, но шум заголовка / нижнего колонтитула. Здесь присутствуют FF. Дефисы удалены. Хуже всего для начала главы большие буквы: «T \ n \ nhe».
pdftotext (с -layout): похоже, но больше отступов. «T» для начала главы.
pdftohtml >> pdfreflow >> htmltotext: он удалил номера страниц, но все еще мусор в заголовке / нижнем колонтитуле. «Он» для начала главы. Дефисы удалены. (Он использует несколько строк для каждого абзаца, но они не являются одинаковыми разрывами строк, как в других версиях!)
В некоторых многопользовательских средах часть процесса загрузки может поступать из сети. Для этого случая systemd по умолчанию ожидают, что сеть будет подключаться к сети, прежде чем будут предприняты определенные шаги.
В отличие от некоторых многопользовательских сред большинство рабочих станций Ubuntu пользователи имеют код операционной системы и драйвера на своих жестких дисках, SSD или Live Boot USB.
Существует ошибка, когда некоторые пользователи ждут очень долгое время, когда сеть появляется во время загрузки, и одна из рекомендаций - установить максимальное время ожидания до 30 секунд. Лучше всего просто отключить службу, особенно когда вы не пользуетесь Интернетом все время и просто хотите работать с вашими электронными таблицами или документами и т. Д.
Для большинства пользователей от 10 до 15 секунд можно отрезать от времени параллельной загрузки, используя:
sudo systemctl disable NetworkManager-wait-online.service
Затем после входа в систему вы, скорее всего, получите сообщение о том, что вы подключены к сети (доступ Wi-Fi или Ethernet в Интернет).
В некоторых многопользовательских средах часть процесса загрузки может поступать из сети. Для этого случая systemd по умолчанию ожидают, что сеть будет подключаться к сети, прежде чем будут предприняты определенные шаги.
В отличие от некоторых многопользовательских сред большинство рабочих станций Ubuntu пользователи имеют код операционной системы и драйвера на своих жестких дисках, SSD или Live Boot USB.
Существует ошибка, когда некоторые пользователи ждут очень долгое время, когда сеть появляется во время загрузки, и одна из рекомендаций - установить максимальное время ожидания до 30 секунд. Лучше всего просто отключить службу, особенно когда вы не пользуетесь Интернетом все время и просто хотите работать с вашими электронными таблицами или документами и т. Д.
Для большинства пользователей от 10 до 15 секунд можно отрезать от времени параллельной загрузки, используя:
sudo systemctl disable NetworkManager-wait-online.service
Затем после входа в систему вы, скорее всего, получите сообщение о том, что вы подключены к сети (доступ Wi-Fi или Ethernet в Интернет).
В некоторых многопользовательских средах часть процесса загрузки может поступать из сети. Для этого случая systemd по умолчанию ожидают, что сеть будет подключаться к сети, прежде чем будут предприняты определенные шаги.
В отличие от некоторых многопользовательских сред большинство рабочих станций Ubuntu пользователи имеют код операционной системы и драйвера на своих жестких дисках, SSD или Live Boot USB.
Существует ошибка, когда некоторые пользователи ждут очень долгое время, когда сеть появляется во время загрузки, и одна из рекомендаций - установить максимальное время ожидания до 30 секунд. Лучше всего просто отключить службу, особенно когда вы не пользуетесь Интернетом все время и просто хотите работать с вашими электронными таблицами или документами и т. Д.
Для большинства пользователей от 10 до 15 секунд можно отрезать от времени параллельной загрузки, используя:
sudo systemctl disable NetworkManager-wait-online.service
Затем после входа в систему вы, скорее всего, получите сообщение о том, что вы подключены к сети (доступ Wi-Fi или Ethernet в Интернет).
На странице man:
NAME
systemd-networkd-wait-online.service, systemd-networkd-wait-online -
Wait for network to come online
На странице man:
NAME
systemd-networkd-wait-online.service, systemd-networkd-wait-online -
Wait for network to come online
На странице man:
NAME
systemd-networkd-wait-online.service, systemd-networkd-wait-online -
Wait for network to come online