Получение количества слов PDF-документа в Evince

Есть ли способ узнать количество слов в документе PDF, который я просматриваю, в Evince, средстве просмотра PDF по умолчанию в Ubuntu? Я могу конвертировать документы в текстовые файлы и получать количество слов из терминала, но я бы очень хотел иметь возможность быстро получить их без использования терминала. Есть ли какой-нибудь плагин, который может сделать это, или он уже встроен, и я просто скучаю по нему?

P.S. Я бы предпочел не менять своего средства просмотра, поскольку Evince является средством просмотра PDF по умолчанию в Ubuntu, и я бы очень хотел сделать как можно больше, используя приложения по умолчанию, поскольку многие из них, включая Evince, действительно хороши. ]

21
задан 8 November 2010 в 22:11

4 ответа

Я не верю, что это возможно (ну, технически это возможно, но не было реализовано).

Вы должны помнить, что Evince - это средство просмотра документов , а количество слов - это функция, которая обычно требуется в редакторе (да, я знаю, что это не всегда так).

Возможно, вы захотите связаться с разработчиками Evince и спросить, будут ли они заинтересованы в реализации этой функции.

0
ответ дан 8 November 2010 в 22:11

Ответ Олафа Лейдингера из списка рассылки Evince:

Я думаю, что такая функция лучше подходит для редакторов документов, так как они имеют больше информации о документе в виде простого средства просмотра, и подсчет слов тривиален. Возьмите файл PDF в качестве примера. То, что вы видите как текст, на самом деле может быть какой-то векторной графической формой. Даже если текст содержится как таковой в файле PDF, эти слова, которые вы видите, могут состоять из нескольких команд «рисовать текст в позиции (y, x)» - например, в случае умлаутов или конца строки. Таким образом, одно слово может считаться несколькими словами. Поэтому я думаю, что может быть трудно реализовать такую ​​функцию надежно. Взгляните на pdftotext, чтобы понять, что я имею в виду.
0
ответ дан 8 November 2010 в 22:11

Как насчет быстрого bash-скрипта, требующего zenity и evince. Когда вызывается без аргумента, он даст вам диалоговое окно, чтобы вы могли выбрать файл. При вызове с аргументом (или после указанного диалогового окна) он одновременно откроет файл в evince и даст вам диалоговое окно с количеством слов.

Другими словами, скопируйте следующее в текстовый файл, который называется evince-word-count.sh или что-то в этом роде, сохраните его где-нибудь по пути (например, ~/bin/), сделайте его исполняемым (либо с помощью щелчка правой кнопкой мыши и свойств Наутилуса, либо с помощью [ 113]),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Теперь, щелкните правой кнопкой мыши по некоторым файлам PDF в nautilus, выберите «Открыть с помощью ...», а затем откройте его с помощью evince-word-count.sh. Теперь, когда вы откроете PDF-файл, он одновременно откроется и покажет вам количество слов.

alt text

0
ответ дан 8 November 2010 в 22:11

Вы можете сделать это через командную строку:

pdftotext filename.pdf - | tr -d '.' | wc -w
0
ответ дан 8 November 2010 в 22:11

Другие вопросы по тегам:

Похожие вопросы: