Не удается проиндексировать .odt файлы с Recoll в Ubuntu

Recoll не может индексировать файлы Open Document.

При просмотре настроек в Recoll я получаю следующий список недостающих помощников:

External applications/commands needed for your file types and not found, as stored by the last indexing pass in /home/pf/.recoll/missing:
  python:chm (application/x-chm)
  python:libxml2/python:libxslt1 (application/vnd.oasis.opendocument.text application/vnd.oasis.opendocument.text-flat-xml application/vnd.openxmlformats-officedocument.spreadsheetml.sheet application/vnd.openxmlformats-officedocument.wordprocessingml.document application/vnd.sun.xml.writer image/svg+xml)
  python:midi (audio/x-karaoke)

Меня не интересуют файлы midi и x-chm, но мне бы очень хотелось, чтобы файлы Open Document были проиндексированы.

Я установил следующие пакеты с apt :

libxml2-dev 
libxslt1-dev
python-lxml

Я также установил следующий пакет с pip :

lxml

Я больше не нашел идей для решения моей проблемы. Любая помощь будет принята с благодарностью.

2
задан 31 December 2020 в 13:33

2 ответа

Для 20.04 -

я обнаружил в lesbonscomptes.com/recoll/pages/features.html#doctypes, которые повторно запрашивают версии> = 1.26, не требующие помощников для файлов Open Office. Это казалось правильным. Я установил recoll в тестовой системе 20.04, и он запросил только вспомогательное антислово . Я это установил. После запуска индекса с нуля он успешно нашел слова в файле .odt

enter image description here

Для 18.04 -

Пакет, который вы устанавливаете, чтобы получить recoll для индексации файлов OpenOffice, это

python- libxslt1

Ссылка здесь

Мне удалось исправить неиндексирование файлов ods в debian, установив эту зависимость: apt-get install python-libxslt1

Я также всегда устанавливаю

python-mutagen
python-chm
ibimage-exiftool-perl
3
ответ дан 3 January 2021 в 22:43

Спасибо за все подсказки, которые я получил.

Я попытался восстановить индекс, но получил ошибку. Я удалил каталог $ HOME / .recoll , чтобы восстановить индекс с нуля, и сообщение о некоторых недостающих помощниках исчезло.

Что случилось? Я предполагаю, что индексы Recoll могли испортиться во время обновления Ubuntu 18.04 до 20.04.

Наконец, проблема, похоже, решена после восстановления индексов с нуля.

Кстати, появились и другие недостающие помощники:

python3:mutagen (application/ogg audio/mpeg video/mp4)
python3:rarfile/python3:unrar (application/x-rar)
unrtf (text/rtf)
wpd2html (application/vnd.wordperfect)

, но я надеюсь решить эту новую проблему с помощью информации, предоставленной Organic Marble по адресу https://lesbonscomptes.com/recoll/pages/features.html

1
ответ дан 3 January 2021 в 22:43

Другие вопросы по тегам:

Похожие вопросы: