Я ищу способ автоматически вставлять мягкие дефисы (­
или символы Юникода) для переноса слов в HTML-документ из командной строки.
1) Каков наилучший способ сделать это из командной строки?
2) Каковы варианты использования различных словарей / правил для переноса слов? Существуют ли правила для языков, отличных от английского?
Мне известно, что некоторые программы, в том числе LibreOffice, описанные в Программы автоматического переноса слов , имеют возможность применять перенос к документу, но я ищу способ сделать это в уже существующем документе HTML без использования программного обеспечения для обработки текста.
Если вам нужно просто заменить -
на ­
, вы можете просто использовать sed
:
sed -i 's/-/\­/g' file.html
Приведенная выше команда отредактирует file.html
и произведет замену. ты хочешь.
Ваш другой вопрос здесь не по теме, поэтому я не буду вдаваться в подробности, но да, разные языки часто имеют разные правила переноса.