Что такое кодировка символов по умолчанию?

Я сам не знаю, насколько глубоко этот вопрос действительно идет (например, для всех, кого я знаю, может быть несколько, в зависимости от моей задачи).

В частности, меня интересуют, какие виды строки используются для обозначения файлов и папок в системе.

Меня также интересует, как строки представлены по умолчанию для сценария bash или python.

8
задан 3 January 2011 в 17:30

18 ответов

Кодирование имен файлов в файловой системе - utf-8. Баш думает в байтах, а не со строками с кодированием. Так что никакой кодировки по умолчанию. Кодировка по умолчанию gnome-terminal - utf-8. Кодировка по умолчанию Python - ascii
3
ответ дан 26 May 2018 в 01:27
  • 1
    Python 3 (я думаю?) По умолчанию меняется на unicode-строки. – Broam 30 August 2010 в 19:32
  • 2
    Тип str () Python 3 является объектом Unicode в кодировке UCS-2 или UCS-4. Как данные считываются или записываются, например. файлы и stdin должны определяться разработчиком приложения / библиотеки, причем стандартом utf-8 (например, print (some_str) будет печатать представление utf-8). – Dennis Kaarsemaker 31 August 2010 в 01:07
  • 3
    Python 3 будет идти в Юникоде, как Ruby 1.9 Python 2 и меньше, например Ruby 1.8 и меньше, основаны на ascii и работают со всеми кодировками, но их идея о значении символов для строк unicode неверна. (что обычно не является проблемой) – Ralf 6 September 2010 в 23:28
  • 4
    gnome-terminal по умолчанию не использует utf-8; он просто использует все, на что настроен ваш язык. (Как я недавно обнаружил сложный путь.) – frabjous 3 January 2011 в 20:37
  • 5
    @DennisKaarsemaker Нет, Python3 не оставляет кодировку только разработчику и использует дефолт UTF-8. Например, Stdin и -out используют кодировку среды по умолчанию! – Robert Siemer 31 October 2014 в 20:25
Кодирование имен файлов в файловой системе - utf-8. Баш думает в байтах, а не со строками с кодированием. Так что никакой кодировки по умолчанию. Кодировка по умолчанию gnome-terminal - utf-8. Кодировка по умолчанию Python - ascii
3
ответ дан 25 July 2018 в 23:15
Кодирование имен файлов в файловой системе - utf-8. Баш думает в байтах, а не со строками с кодированием. Так что никакой кодировки по умолчанию. Кодировка по умолчанию gnome-terminal - utf-8. Кодировка по умолчанию Python - ascii
3
ответ дан 31 July 2018 в 12:05
Кодирование имен файлов в файловой системе - utf-8. Баш думает в байтах, а не со строками с кодированием. Так что никакой кодировки по умолчанию. Кодировка по умолчанию gnome-terminal - utf-8. Кодировка по умолчанию Python - ascii
3
ответ дан 2 August 2018 в 04:32
  • Кодирование имен файлов в файловой системе - utf-8.
  • Bash думает в байтах, а не с информацией о строках с кодировкой. Так что никакой кодировки по умолчанию. Кодировка gnome-terminal по умолчанию - utf-8
  • . По умолчанию кодировка Python - ascii
3
ответ дан 4 August 2018 в 21:06
  • Кодирование имен файлов в файловой системе - utf-8.
  • Bash думает в байтах, а не с информацией о строках с кодировкой. Так что никакой кодировки по умолчанию. Кодировка gnome-terminal по умолчанию - utf-8
  • . По умолчанию кодировка Python - ascii
3
ответ дан 6 August 2018 в 04:36
  • Кодирование имен файлов в файловой системе - utf-8.
  • Bash думает в байтах, а не с информацией о строках с кодировкой. Так что никакой кодировки по умолчанию. Кодировка gnome-terminal по умолчанию - utf-8
  • . По умолчанию кодировка Python - ascii
3
ответ дан 7 August 2018 в 22:46
  • Кодирование имен файлов в файловой системе - utf-8.
  • Bash думает в байтах, а не с информацией о строках с кодировкой. Так что никакой кодировки по умолчанию. Кодировка gnome-terminal по умолчанию - utf-8
  • . По умолчанию кодировка Python - ascii
3
ответ дан 10 August 2018 в 10:51
  • Кодирование имен файлов в файловой системе - utf-8.
  • Bash думает в байтах, а не с информацией о строках с кодировкой. Так что никакой кодировки по умолчанию. Кодировка gnome-terminal по умолчанию - utf-8
  • . По умолчанию кодировка Python - ascii
3
ответ дан 13 August 2018 в 17:26
  • 1
    Python 3 (я думаю?) По умолчанию меняется на unicode-строки. – Broam 30 August 2010 в 19:32
  • 2
    Тип str () Python 3 является объектом Unicode в кодировке UCS-2 или UCS-4. Как данные считываются или записываются, например. файлы и stdin должны определяться разработчиком приложения / библиотеки, причем стандартом utf-8 (например, print (some_str) будет печатать представление utf-8). – Dennis Kaarsemaker 31 August 2010 в 01:07
  • 3
    Python 3 будет идти в Юникоде, как Ruby 1.9 Python 2 и меньше, например Ruby 1.8 и меньше, основаны на ascii и работают со всеми кодировками, но их идея о значении символов для строк unicode неверна. (что обычно не является проблемой) – Ralf 6 September 2010 в 23:28
  • 4
    gnome-terminal по умолчанию не использует utf-8; он просто использует все, на что настроен ваш язык. (Как я недавно обнаружил сложный путь.) – frabjous 3 January 2011 в 20:37
  • 5
    @DennisKaarsemaker Нет, Python3 не оставляет кодировку только разработчику и использует дефолт UTF-8. Например, Stdin и -out используют кодировку среды по умолчанию! – Robert Siemer 31 October 2014 в 20:25

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 26 May 2018 в 01:27

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 25 July 2018 в 23:15

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 31 July 2018 в 12:05

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 2 August 2018 в 04:32

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 4 August 2018 в 21:06

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 6 August 2018 в 04:36

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 7 August 2018 в 22:46

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 10 August 2018 в 10:51

Кодировка символов по умолчанию - UTF-8 (Unicode), хотя почти все (возможно, все по умолчанию) имена файлов являются регулярными символами ASCII, обычными для большинства кодировок.

Я не знайте, что вы подразумеваете под «количеством строк, представленными сценарием bash или python». Вы можете использовать символы Unicode в сценариях bash на Ubuntu, но обычно с помощью сценария bash вы вызываете другие программы, и будут ли эти другие программы обрабатывать их, это другое дело. Конечно, это возможно и с Python, хотя вы захотите ознакомиться с пакетами и настройками, связанными с ним.

7
ответ дан 13 August 2018 в 17:26

Другие вопросы по тегам:

Похожие вопросы: