|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Victor Wagner 2:5020/400 22 Nov 2005 11:43:56 To : Denis Kostousov Subject : Re: utf8 + псевдографика -------------------------------------------------------------------------------- Denis Kostousov <sandello@permonline.ru> wrote: DK> Mikhail Gusarov wrote: >> В unicode нет >> двухбайтовых кодов, там есть числа. DK> А как эти числа транслируются в коды? В лоб? Тогда не вижу DK> разницы А разными способами. Можно никак не транслировать, а тупо писать 2 или 4 байтовые числа (соответственно UCS2 или UCS4). Сразу прилетает привет от архитектуры процеессора под названием "порядок байт". Можно писать двухбайтовые числа но предусмотреть возможность записи с помощью некоторой эскейп-последовательности тех чисел, которые больше 65536. А задодно и использовать в начале файла символ-индикатор порядка байтов. Будет UTF-16. Можно писать в виде 1-байтовых чисел все числа меньше 127, и кодировать многобайтными последовательностями всё остальное - UTF-8. А можно извратиться и записать это так, что не будет ни одного байта с ненулевым старшим битом - UTF-7. -- Съесть врага живьем - это еще ничего, труднее не оставить за ним последнее слово. --- С.Е. Лец --- ifmail v.2.15dev5.3 * Origin: Free Net of Leninsky,45 (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/15178827e793a.html, оценка из 5, голосов 10
|