Как прочитать файл с кодировкой iso-8859-1 latin1?

Какой пакет следует установить, чтобы можно было читать файлы с кодировкой iso-8859-1 latin1?

В настоящее время я вижу только странные символы вместо текста.

% locale

LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
1
задан 25 March 2013 в 20:27

1 ответ

Кодировка latin1 «в основном» совместима с UTF-8, поскольку оба кодирования являются надмножествами ASCII. Это означает, что вы должны видеть нормальные буквы (a-z), но не диакритические знаки (é, è и т. Д.). Давайте попробуем понять, какова на самом деле кодировка вашего файла.

Во-первых, команда file может иногда обнаруживать кодирование. Просто используйте:

$ file weird_file

Вы можете получить weird_file: ISO-8859 text для латиницы 1, weird_file: UTF-8 Unicode text для UTF-8 или что-то еще. Теперь, если вы определили, что это latin1, лучший способ отобразить его - это открыть редактор, такой как gedit, и выбрать правильную кодировку при открытии файла. Если вы хотите преобразовать файл в UTF-8, вы можете затем «Сохранить как» и запросить UTF-8.

Если вы все еще не знаете кодировку, попробуйте открыть документ в Libre Office, обычно он хорошо обнаруживается. Также возможно, что ваш файл поврежден (например, текст UTF-8 интерпретируется как latin1 и сохраняется как UTF-8), или, что более вероятно, он никогда не содержал текст. Не стесняйтесь загружать его, чтобы мы могли его проверить.

0
ответ дан 25 March 2013 в 20:27

Другие вопросы по тегам:

Похожие вопросы: