|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Victor Wagner 2:5020/400 18 Apr 2006 15:45:58 To : Aleksey Barabanov Subject : Re: Сугубо "провокативный" пост -------------------------------------------------------------------------------- Aleksey Barabanov <abb@wessen.ru> wrote: >>encoding это шифрование, в данном случае AB> представление >>кодировки некоторым алгоритмом. У вас русский язык другой >>какой-то. Charset принято переводить как "набор символов", а >>encoding - как "кодировка". Соответственно, на этом >>обсуждение и исчерпывается, ибо в этих терминах unicode - >>это не кодировка. AB>Еще раз, кодировка это соотвествие некоторых бинарных AB>кодов, некоторым символам, т.е. charset ЭТО КОДИРОВКА. А Так вот, в unicode HЕТ бинарных кодов. Есть порядковые номера, просто натуральные числа. В диапазоне от 0 до нескольких десятков (или уже сотен) тысяч. Больше 2^16 это точно. А кодировки UCS2, UCS4, UTF7, UTF8 и UTF16 - это как раз способы бинарного представления оных порядковых номеров. С теми charset-ами где набор символов не превосходит 256 штук - проще. Там есть однозначный и общепринятый способ кодирования номеров символов в наборе - один байт - один номер. Поэтому понятия набора символов и кодировки оказываются практически совпадающими. Впрочем, можно еще адобовскую кодировку вспомнить, где символам соответствуют не номера, а названия. -- --- ifmail v.2.15dev5.3 * Origin: Free Net of Leninsky,45 (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/1517814363441.html, оценка из 5, голосов 10
|