Мне было интересно, можно ли искать среди содержимого документов
, возможно, разных типов: pdf, djvu, html, текстовый файл, код сценария программирования ... возможно, под разными каталогами под каждым документы смешиваются вместе и, возможно, с другими файлами без документов?Является ли grep способным делать такие вещи?
Спасибо и приветствую!
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find . -name '*.*' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04 [ ! d3]
В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find . -name '*.*' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04 [ ! d3]
В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find . -name '*.*' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04 [ ! d3]
В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find. -name '*. *' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04
В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find. -name '*. *' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04
В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find. -name '*. *' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04
В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .
Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'
find. -name '*. *' -exec grep --color 'getURI' {} +
Это отлично работает на моем Ubuntu 12.04
В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .
Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.
Установить:
sudo apt-get install recoll