Вопросы Теги

ПРОБЛЕМА: данные Unicode, поврежденные программой ascii

Я использовал html2text программу для извлечения unicode devanagari из html-файла. Но он дает выходные данные,

"à¤¶à ¥ à¤ ° à¤|à ¥ à¤§à¤§à¤¾à¤¨à¤¾à¤¨à¤¾¾à¤".

В Windows я исправлю это, используя функцию преобразования в unicode в Notepad ++.

Что делать для Ubuntu?

Обновление: для целей тестирования я добавляю следующее:

"à¤¶à ¥ à¤ ° à¤|à ¥ à¤§à¤§à¤¾à ¤¨à¤¾à¤¨à¤¾à¤».

echo आचार्यपूज्यपादानामिष्टं | html2text

unicode ascii

задан Ramaprakasha 18 June 2014 в 12:49

0 ответов

unicode ascii