Есть ли путь к cat
или less
a. файл odt так же, как antiword
для .doc файлов?
Решение использует odt2txt
. Теперь, эта команда обеспечивается двумя различными пакетами, а именно, один названный odt2txt
то, что можно установить с
sudo apt-get install odt2txt
и пакетом unoconv
(который предлагает также преобразования командной строки между большим количеством libreoffice форматов), который установлен
sudo apt-get install unoconv
Если у Вас есть эти два, можно переключиться между ними использующий альтернативный механизм:
sudo update-alternatives --config odt2txt
Если Вы используете odt2txt
если пакетом odt2txt
Вы просто используете
odt2txt file.odt
при использовании unoconv
если пакет необходимо использовать
odt2txt --stdout file.odt
Передайте их по каналу к less
чтобы иметь как будто меньше испытывают (odt2txt file.odt | less
)
Заметьте это, если Вы не используете --stdout
опция, unoconv-обеспеченный пакет запишет результат в названном файле file.txt
.
Предложенный пакет распределением, кажется, тот от odt2txt
пакет (это имеет более высокий приоритет по умолчанию в альтернативной системе); наверняка это имеет меньше зависимостей.
Можно просмотреть текст без любой специальной утилиты. Файл ODT является переименованным архивом zip. Разархивируйте его, и Вы будете видеть несколько файлов. Один из них, content.xml
содержит весь текст и more
или less
читаем.
odt2txt file.odt
исходный код и compilebale, работающий, zip может быть загружена здесь:
https://github.com/dstosberg/odt2txt /
или установленный sudo apt-get install odt2txt
Вы не можете cat
или less
или more
.odt файл, потому что это - двоичный файл. Это на самом деле - как был сказан ранее - переименованный архив .zip, таким образом, необходимо извлечь content.xml
файл, но что, как это подразумевает, XML-документ, таким образом, необходимо обработать его как таковой для извлечения информации из него.