Итак, допустим, у меня есть 10 файлов, которые можно искать с помощью pdfgrep
. Некоторые из них доступны для поиска с использованием grep, а некоторые нет
Почему это так? Какова черта, которая позволяет PDF-файлам быть greppbale?
А без указания источника этих PDF-файлов трудно сказать наверняка, но PDF-файл может быть одним из нескольких:
Я бы предположил, что те, кого вы не можете использовать, не сделали OCR. Есть процессы для этого, но это немного более важный вопрос.