Можно ли искать среди контента документы?

Question 1

Мне было интересно, можно ли искать среди содержимого документов

, возможно, разных типов: pdf, djvu, html, текстовый файл, код сценария программирования ... возможно, под разными каталогами под каждым документы смешиваются вместе и, возможно, с другими файлами без документов?

Является ли grep способным делать такие вещи?

Спасибо и приветствую!

Question 2

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

sudo apt-get install recoll

Question 3

Question 4

[D0] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker, который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 5

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

find . -name '*.*' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04 [ ! d3]

В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.

Question 6

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

sudo apt-get install recoll

Question 7

Question 8

[D0] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker, который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 9

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

find . -name '*.*' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04 [ ! d3]

В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.

Question 10

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

sudo apt-get install recoll

Question 11

[D0] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker, который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 12

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

find . -name '*.*' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04 [ ! d3]

В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.

Question 13

Question 14

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 15

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

Question 16

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

Question 17

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

Question 18

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 19

Question 20

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

Question 21

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

Question 22

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 23

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

Question 24

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

Question 25

Question 26

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

Question 27

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

bdr529 · Answer 1 · 25 July 2018 в 22:13

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

sudo apt-get install recoll

DrSAR · Answer 2 · 25 July 2018 в 22:13

[D0] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker, который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

user175667 · Answer 3 · 25 July 2018 в 22:13

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

find . -name '*.*' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04 [ ! d3]

В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.

bdr529 · Answer 4 · 2 August 2018 в 03:41

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

sudo apt-get install recoll

DrSAR · Answer 5 · 2 August 2018 в 03:41

[D0] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker, который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

user175667 · Answer 6 · 2 August 2018 в 03:41

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

find . -name '*.*' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04 [ ! d3]

В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.

bdr529 · Answer 7 · 4 August 2018 в 19:45

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

sudo apt-get install recoll

DrSAR · Answer 8 · 4 August 2018 в 19:45

[D0] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker, который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

user175667 · Answer 9 · 4 August 2018 в 19:45

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

find . -name '*.*' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04 [ ! d3]

В любом случае, я не думаю, что команда grep может искать в двоичных документах, таких как PDF. Также использование вышеприведенной команды в большом дереве каталогов может быть очень обременительным с точки зрения вычислительное время. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария система документооборота, которую может помочь LogicalDoc.

DrSAR · Answer 10 · 6 August 2018 в 03:49

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

user175667 · Answer 11 · 6 August 2018 в 03:49

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

bdr529 · Answer 12 · 6 August 2018 в 03:49

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

bdr529 · Answer 13 · 7 August 2018 в 21:45

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

DrSAR · Answer 14 · 7 August 2018 в 21:45

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

user175667 · Answer 15 · 7 August 2018 в 21:45

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

bdr529 · Answer 16 · 10 August 2018 в 09:58

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

DrSAR · Answer 17 · 10 August 2018 в 09:58

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

user175667 · Answer 18 · 10 August 2018 в 09:58

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

user175667 · Answer 19 · 13 August 2018 в 16:18

Вы можете запустить команду в файлах, возвращаемых командой find. Например, со следующей командой я перечисляю все файлы, начиная с текущего каталога, и каждый из них запускаю команду grep для поиска строки 'getUri'

  find.  -name '*. *' -exec grep --color 'getURI' {} +

Это отлично работает на моем Ubuntu 12.04

В любом случае, я не думаю что команда grep может выполнять поиск в двоичных документах, таких как PDF. Также использование команды выше в большом дереве каталогов может быть очень обременительным с точки зрения вычислительного времени. Еще один аспект, который следует учитывать, заключается в том, что вы не можете искать строку в растровом PDF-файле, в зависимости от типа сценария могла бы помочь система управления документами LogicalDoc .

DrSAR · Answer 20 · 13 August 2018 в 16:18

[D2] Да. Посмотрите на FindingFiles в документации сообщества для Ubuntu. Тот, который я использовал некоторое время, был Tracker , который способен индексировать большинство типов документов и, благодаря сохранению индекса, обновленного в фоновом режиме, был удивительно быстрым при поиске.

bdr529 · Answer 21 · 13 August 2018 в 16:18

Я использую Recoll. Он находится в репозиториях. Он также выполняет поиск pdf-метаданных. Вы можете выбрать, какие папки индексируются. Это очень быстро.

Установить:

  sudo apt-get install recoll

Можно ли искать среди контента документы?

21 ответ

Другие вопросы по тегам:

Похожие вопросы: