Настройте индексатор файла и документ retrival поисковая система для сервера государственной сети апачской человечности?

Я не уверен, не ищу ли я просто правильный путь к решению, но я, может казаться, не нахожу прямой ответ для своих потребностей проекта, здесь идет. Я приношу извинения, если это - дублирующееся сообщение.

Моя компания имеет веб-сервер Apache, и мы просто настраиваем новый раздел со всеми нашими документами исследования, они находятся в HTML и формате PDF, нам нужно, чтобы наши удаленные клиенты смогли ввести критерии поиска для нахождения документов, которые они ищут на веб-сервере. Источники документа находятся в нескольких папках все локально сохраненные на веб-сервере. Это очень утомительно для наших клиентов для ручного парсинга индекса каталога для нахождения документов, которых они требуют. Не только имя файла и метаданные должны быть индексированы, но и содержание самих файлов должно быть индексировано также. Я сделал это очень легко с веб-серверами Microsoft с их созданным в индексации и функции поиска, но выполнение этой операции на Ubuntu с apache2 оказывается неуловимым.

Как я могу настроить систему, чтобы смочь работать, необходимая функциональность поиска и извлечения документа в сходстве стиля говорят, например, что Google, но только для локального содержания удаленно через веб-браузер?

Спасибо за Ваш вход!

1
задан 27 February 2019 в 19:57

1 ответ

Ну, мой приятель видел мое сообщение и и написал это, он видел, что recoll на самом деле имеет веб-интерфейс, и я должен изучить его. Они делают и это работает, и установка не является слишком громоздкой. Я должен отметить, что это находится в Python и очень настраиваемо. Это - процедура для пользователей Ubuntu, хотя она работает на примерно что-либо, просто следуйте инструкциям на authers странице, ссылки на исходный материал и инструкции для других платформ в конце этого документа. Я должен отметить, что его документация является sub паритетом, и Вам, вероятно, придется соединить конечное решение как, я сделал:

Сначала установите repo и программное обеспечение;

sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on
sudo apt-get update 
sudo apt-get install -y recoll python-recoll

Модификация-wsgi установки

sudo apt-get install -y libapache2-mod-wsgi

Я настоятельно рекомендую уже иметь apache2, уже настроенный, или можно получить полностью определенное доменное имя и ошибки IP-адреса. установка имени сервера к локальному IP-адресу сервера должна зафиксировать это.

Получите репозиторий GitHub для recoll webui:

https://github.com/koniu/recoll-webui

Просто нажмите 'clone or download button' для загрузки архива. Извлеките это к Вашему/var/www каталогу It должно создать папку 'recoll-webui-master'

Двойная проверка это не удваивала ставку на каталогах:

Перейдите в/var/www/recoll-webui-master и удостоверьтесь, что файлы там и не далее в подкаталоге, или Вы получите ошибки.

Затем отредактируйте файл;

/etc/apache2/mods-enabled/wsgi.conf

добавьте следующее в конце раздела "IfModule", но не после.

WSGIDaemonProcess recoll user=dockes group=dockes \threads=1 processes=5 отображаемое имя = % {ГРУППА} \путь Python =/var/www/recoll-webui-master WSGIScriptAlias/recoll/var/www/recoll-webui-master/webui-wsgi.py Порядок WSGIProcessGroup recoll позволяет, отклоняет, позволяют от всех

Я не знаю, производит ли изменение форматирования, отправляющее здесь, функциональность, если это действительно обращается к документации авторов для исходного форматирования.

Измените пользователя и группу (прикрепления в примере) заботящийся это, он - тот, который владеет индексом (.recoll, находится в его корневом каталоге).

удостоверьтесь, что ~/.recoll сделал, чтобы владелец назвал и прочитал полномочия записи учетной записи, используемой на сервере с полномочиями только для чтения для всех остальных, или Вы получите ошибку 500 внутренних ошибок сервера. Не используйте 'корень'!

Обратите внимание, что приложение Recoll WebUI является главным образом однопоточным, таким образом, это мало полезно (и может на самом деле быть контрпродуктивным в некоторых случаях) указывать несколько потоков на строке WSGIDaemonProcess. Укажите несколько процессов вместо этого для помещения нескольких центральных процессоров для работы над одновременными запросами.

Затем выполните следующее для перезапуска Apache:

sudo apachectl restart

Примечание Заботится, в котором Вы нуждаетесь / в конце URL, используемого для доступа к поиску (использование: http://my.server.com/recoll/, не http://my.server.com/recoll), еще файлы кроме самого сценария не найдены (страница выглядит странной, и поиск не работает).

После того как Вы имеете, это все настроило Вас, должен выполнить recoll и индексировать желаемые папки, которые, по-видимому, могут быть любой папкой в Вашей системе так бояться индексировать папки, которые Вы не хотите выставленный.

Также для просмотра файлов по сети то, что вы оказывались перед необходимостью вносят изменение установки.

enter image description here

Источники:

https://www.lesbonscomptes.com/recoll/download.html

https://www.lesbonscomptes.com/recoll/pages/recoll-webui-install-wsgi.html

https://github.com/koniu/recoll-webui

Я надеюсь, что это помогает! Не 100%, в чем я нуждаюсь только его завершение и буду хорошо работать, пока я не заставляю время изменять код для удовлетворения скромным изменениям, которые я хочу.

1
ответ дан 7 December 2019 в 15:07

Другие вопросы по тегам:

Похожие вопросы: