Наведите левую и правую клавиши мыши на прокрутку

Эти файлы Windows с персидским текстом закодированы в Windows-1256. Поэтому он может быть расшифрован командой, подобной OP, но с разными кодировками. А именно:

recode Windows-1256..UTF-8 <Windows_file.txt > UTF8_file.txt (денонсировано по жалобам оригинального плаката, см. Комментарии)

iconv -f Windows-1256 Windows_file.txt > UTF8_file.txt

Предполагается, что переменная среды LANG установлена ​​в локаль UTF-8. Чтобы преобразовать в любую кодировку (UTF-8 или иначе), независимо от текущей локали, можно сказать:

iconv -f Windows-1256 Windows_file.txt -t ${output_encoding} > ${output_file}

Оригинальный плакат также путают с семантикой инструментов перекодировки текста (recode, iconv). Для исходной кодировки (источник .. или -f) необходимо указать кодировку, с которой файл Windows-1256 (созданной программой). Не некоторые (наивные) догадки, основанные на персонажах моджибаке в программах, которые пытаются (но не могут) прочитать его. Попытка либо ISO-8859-15, либо WINDOWS-1252 для персидского текста была явно тупиковой: эти кодировки просто не содержат персидской буквы.

0
задан 3 February 2018 в 21:22

0 ответов

Другие вопросы по тегам:

Похожие вопросы: