Скажем, у меня есть 2 000.ODT файлов. Их имена являются случайными числами. Как я иду о поиске, скажем, "оценивая список"? Как я нахожу документ, в котором я нуждаюсь, не открывая всех их один за другим и проверяющий, чтобы видеть, является ли это правильное?
Там некоторая программа должна перерыть слова в документах, не открывая их?
Вам понадобится решение для полнотекстовой индексации, которое имеет фильтр для поддержки индексации полного текста этих файлов.
Одним из вариантов для этого является пакет tracker
в Ubuntu. Для этого вам нужно будет установить tracker
и tracker-miner-fs
, и вам, вероятно, понадобится tracker-gui
для пользовательского интерфейса инструмента поиска.
Альтернативой является Recoll . Как только он проиндексировал ваши файлы, он довольно быстро находит соответствующие файлы. Также поиск внутри ОРВ, ОРС и PDF. Работает довольно хорошо.
Это работает для всего, что может прочитать openoffice; Я хотел odt только в этом случае:
find -name \*.odt -exec sh -c 'unoconv --stdout -f text "{}" | grep -i string_to_search_for' \;