Ошибка кодирования и декодирования в неанглийском имени сжатого файла

У меня есть rar-файл. После извлечения он генерирует файл с китайским именем, который показан в Nautilus как:

ѧ. . ѧ .2008.djvu (неверная кодировка)

В терминале это показано как:

<BD><FC><B4><FA><D7><E9><BA><CF>ѧ.<CD><F5><CC><EC><C3><F7>.<B4><F3><C1><AC><C0><U+DE64><B4><F3>ѧ<B3><F6><B0><E6><C9><E7>.2008.djvu

Содержимое rar-файла, указанного в unrar, является correct:

$ unrar l 近代组合学.王天明.大连理工大学出版 社.2008.rar UNRAR 3.93 freeware Copyright (c) 1993-2010 Alexander Roshal Archive 近代组合学.王天明.大连理工大学出版社.2008.rar Name Size Packed Ratio Date Time Attr CRC Meth Ver ------------------------------------------------------------------------------- 近代组合学.王天明.大连理工大学出版社.2008.djvu 6190416 6187189 99% 03-06-11 10:33 .....A. 98320D40 m3g 2.9 ------------------------------------------------------------------------------- 1 6190416 6187189 99%

Файл не может быть открыт, если я не изменю его имя на что-то вроде 1.djvu.

Мне было интересно, почему персонажи не отображаются правильно с китайским именем сжатого файла, в то время как я могу создать каталог или файл с китайским именем?

Как мне это сделать?

Спасибо и привет!

6
задан 11 June 2011 в 01:37

36 ответов

попробуйте следующее:

  unrar --enable-charset x $ 1  
1
ответ дан 10 August 2018 в 09:36

Похоже, что имя файла создает другую кодировку символов, чем ваша среда. Символ ѧ (CYRILLIC SMALL LETTER LITTLE YUS) скорее всего не является частью китайского имени файла.

У вас есть какая-либо информация об операционной системе и языковых настройках, в которой был создан файл? Вы знаете, какие кодировки символов являются общими для кодирования китайских имен файлов?

Если вы знаете кодировку имен файлов, вы можете использовать convmv (не установленный по умолчанию), чтобы преобразовать его в кодировку вы используете (скорее всего UTF-8).

3
ответ дан 10 August 2018 в 09:36

У меня была такая же проблема с rar-файлом, который содержал имена с кириллическими буквами. Я смог исправить это, переустановив unrar , как это предлагается здесь :

  $ sudo apt-get удалить rar $ sudo apt-  get remove unrar $ sudo apt-get install unrar  

Оказалось, что по умолчанию версия с открытым исходным кодом rar & amp; В Ubuntu установлены утилиты unrar unrar : «unrar 0.0.1 Copyright (C) 2004 Ben Asselstine, Jeroen Dekkers».

После переустановки unrar фактическая версия была установлена ​​из репозитория «ограниченного» (проприетарного программного обеспечения) (обратите внимание, что это должно быть включенный в ваши настройки обновления): «UNRAR 5.40 бесплатно Copyright (c) 1993-2016 Александр Рошаль»

Эта версия обрабатывает символы Unicode, по крайней мере, это работало для меня с кириллическими буквами.

Обратите внимание, что удаление версии rar / unrar с открытым исходным кодом также устранило проблему с программным обеспечением GUI: Rar archive with Cyrillic letters [!d6]

1
ответ дан 10 August 2018 в 09:36

У меня была такая же проблема с rar-файлом, который содержал имена с кириллическими буквами. Я смог исправить это, переустановив unrar , как это предлагается здесь :

  $ sudo apt-get удалить rar $ sudo apt-  get remove unrar $ sudo apt-get install unrar  

Оказалось, что по умолчанию версия с открытым исходным кодом rar & amp; В Ubuntu установлены утилиты unrar unrar : «unrar 0.0.1 Copyright (C) 2004 Ben Asselstine, Jeroen Dekkers».

После переустановки unrar фактическая версия была установлена ​​из репозитория «ограниченного» (проприетарного программного обеспечения) (обратите внимание, что это должно быть включенный в ваши настройки обновления): «UNRAR 5.40 бесплатно Copyright (c) 1993-2016 Александр Рошаль»

Эта версия обрабатывает символы Unicode, по крайней мере, это работало для меня с кириллическими буквами.

Обратите внимание, что удаление версии rar / unrar с открытым исходным кодом также устранило проблему с программным обеспечением GUI: Rar archive with Cyrillic letters [!d6]

1
ответ дан 13 August 2018 в 15:47

попробуйте следующее:

  unrar --enable-charset x $ 1  
1
ответ дан 13 August 2018 в 15:47

Похоже, что имя файла создает другую кодировку символов, чем ваша среда. Символ ѧ (CYRILLIC SMALL LETTER LITTLE YUS) скорее всего не является частью китайского имени файла.

У вас есть какая-либо информация об операционной системе и языковых настройках, в которой был создан файл? Вы знаете, какие кодировки символов являются общими для кодирования китайских имен файлов?

Если вы знаете кодировку имен файлов, вы можете использовать convmv (не установленный по умолчанию), чтобы преобразовать его в кодировку вы используете (скорее всего UTF-8).

3
ответ дан 13 August 2018 в 15:47
  • 1
    Благодаря! Я предполагаю, что он был создан в Windows. Из Википедии китайскими кодировками являются китайский Guobiao: GB 2312, GBK (код Microsoft 936) и GB 18030. – Tim 11 June 2011 в 01:48

Другие вопросы по тегам:

Похожие вопросы: