Я пытаюсь читать параллельные англо-японские тексты. Когда я открываю их в Firefox или Chromium , я просто вижу тарабарщину: Разметка в Кейт , я вижу символы отображаются правильно. С gedit я вижу тарабарщину, но это не то же самое, что с браузером.
Редактор Kate показывает, что кодировка - Shift_jis , но когда я настраиваю это как запасную кодировку, ничего не происходит.
Пожалуйста, не могли бы вы объяснить это поведение и помочь мне исправить его?
Проблема заключалась в метаданных html-файлов. Прочитав эту статью , я понял, что все, что мне нужно сделать, это изменить заголовок:
<HTML><HEAD><META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
на
<HTML><HEAD><META encoding=utf-8 charset=shift-jis
NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">