Команда wc
то, которое используется для подсчета, не работает непосредственно с файлами Office.
Например, я создал устройство записи .odt
файл и я записали внутренние 7 слов. Затем я попробовал wc -w file.odt
вывод равнялся 136, который не логичен вообще.
При попытке вышеупомянутого на каком-либо файле, Вы можете просто wc -w
без проблем.
Теперь мой вопрос состоит в том, как использовать wc
команда с Libre/OpenOffice?
Обновление : можно использовать libreoffice
, который установлен по умолчанию, чтобы преобразовать файл в файл простого текста и затем считать символы / слова / строки с помощью wc
:
Для подсчета символов:
libreoffice --headless --convert-to txt:Text <path_to_source_file> &> /dev/null && < <plaint_text_file_name> wc -c && rm test.txt
*< path_to_odt_file> = соедините каналом к исходному файлу; < plain_text_file_name> = название исходного файла с расширением, замененным к .txt
;
Для подсчета слов:
libreoffice --headless --convert-to txt:Text <path_to_source_file> &> /dev/null && < <plaint_text_file_name> wc -w && rm test.txt
*< path_to_odt_file> = соедините каналом к исходному файлу; < plain_text_file_name> = название исходного файла с расширением, замененным к .txt
;
Для подсчета строк:
libreoffice --headless --convert-to txt:Text <path_to_source_file> &> /dev/null && < <plaint_text_file_name> wc -l && rm test.txt
*< path_to_odt_file> = соедините каналом к исходному файлу; < plain_text_file_name> = название исходного файла с расширением, замененным к .txt
;
Я нашел эту команду:
Для подсчета количества слов
unzip -p doc.odt content.xml | sed 's|<[^>]*>| |g' | wc -w
Для подсчета количества Строк
unzip -p doc.odt content.xml | sed 's|<[^>]*>| |g' | wc -l
Для подсчета количества символов
unzip -p doc.odt content.xml | sed 's|<[^>]*>| |g' | wc -c
Существует также автономное odt2txt
(unoconv
, пакет также предлагает odt2txt
):
sudo apt-get install odt2txt
odt2txt foo.odt | wc -w
страницы справочника Ubuntu удивительно испытывают недостаток в странице справочника его.