Ответ от Olaf Leidinger в списке рассылки Evince:
Я думаю, что такая функция лучше подходит для редакторов документов, так как у них есть больше информации о документе как простой просмотрщик, а подсчет слов тривиален , Возьмите файл PDF в качестве примера. То, что вы видите как текст, может фактически быть какой-то векторной графической формой. Даже если текст содержится как таковой в файле PDF, эти слова, которые вы видите, могут состоять из нескольких «рисовать текст в позиции (y, x)» - команды - например. в случае умлаутов или конца строки. Таким образом, одно слово может считаться несколькими словами. Поэтому я думаю, что было бы сложно реализовать такую функцию надежно. Посмотрите на pdftotext, чтобы понять, что я имею в виду.