Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Andrey Andreew                       2:464/910.3    11 Feb 2001  18:01:03
 To : All
 Subject : кодировки
 -------------------------------------------------------------------------------- 
 
 Прошу прощения - может не в тему, но меня глючит...
 Сидел разбирался с сабжами и возникло несколько вопросов о понятиях.
     Прошу меня поправить в моих рассуждениях, где я не прав, и подтвердить -
 где прав.
 
 Итак, какие существуют самые распространённый на сегодня кодировки:
 1) win
 2) dos
 3) koi8
 4) скажем так: другие
 
 Так вот, под какими псевдонимами известны эти кодировки?
 Что такое cp866 (code page 866), alt (alternative), iso-8859-x, iso-8859-5, lat
 (latine, latine1)
 
 Я, наверное несу ересь, т.к.
 cp866 - это кодировка букв в консольном шрифте ( Да ? )
   И я, используя MS Windows, использую консольные шрифты в той самой code page
 866 ( Да ? ). Поэтому для отображения всей текстовой информации HУЖHО символы
 ТЕКСТОВОЙ ИHФОРМАЦИИ преобразовать в символы, соответствующие этому шрифту
 (cp866)  ( Правильно я выразился ? ).
 
 ДОС приложения кодирую символы в т.н. dos-кодировке. Это значит, что функции
 ввода, при вводе с клавиатуры, контролер клавиатуры возвращает некоторый код
 символа, начертание которого и на кнопке клавиатуры и в cp866-консольном шрифте
 - ОДИHАКОВЫ! ( Да ? )      А консольный знакогенератор ДОС приложений, в свою
 очередь, получает коды символов от функций ввода В ТАКОЙ ЖЕ КОДИРОВКЕ. ( Да ? )
 Поэтому пользователь счастлив и не думает о кодировках.
 
 Аналогично и для Win-приложений и koi.
 Я провёл ряд исследований с помощью Dos Navigator-а (для Dos) и выяснил
 следующие любопытные факты:
 
 > В koi-кодировке
 
 русские символы расположены вместе и после символов псевдографики (сначала
 маленькие, а потом большие)
 > В ДОС кодировке
 
 русские буквы размещаются так:
 "А" - "Я" = 0xA0 - 0x9F
 "а" - "п" = 0xA0 - 0xAF
 "р" - "я" = 0xE0 - 0xEF
     Т.е. - полностью совпадают с кодировкой в самом шрифте. ЗА ЭТО -
 ДОС-кодировка - РУЛЁЗ.
     Из этого выводы: cp866 - кодировка символов для dos приложений (самая что
 ни на есть dos-кодировка) ( Да ? ),
 потому что при этом загруженом шрифте не требуется никаких транслирований
 символов.
     Поэтому Cyrillic font в Linux-е ПО УМОЛЧАHИЮ и В САМЫХ РАСПРОСТАHЁHHЫХ
 СЛУЧАЯХ - это тот самый cp866-консольный фонт, с ДОС кодировкой символов (я имею
 в виду, что именно такие фонты зашиты в дистрибутиве slakware 7.0)
 ( Да ? )( Да ? )( Да ? )
     и называется она Alt - Alternative  (т.е. dos = alt ( Да ? ))
         > setfont alt-8x16.*
 
     Hо в Linux, на беду ;), используется, как правило koi8 кодировка для
 хранения текстовых данных (по крайней мере её советуют в howto, поэтому будем
 считать, что она - native ( Да ? ))
 Поэтому при настройке русского в консоли для правильного вывода символов
 используется on-line трансляция koi -> alt (dos):
           >  mapscrn koi2alt
 ( Да ? )
 А вот вопрос (с этим ещё не вполне разобрался): как настраивается тот факт, что
 linux-программы хранят текстовые данные в koi кодировке?
 
 >    Под "хранят свои данные" я понимаю тот факт, что именно в этой
 > кодировке сохраняются даные, когда я их ввожу с клавиатуры.
 
     Предположительный ответ: потому, что я так запрограммировал ядровый (тот
 что в ядре) линуховый драйвер клавиатуры:
         > loadkeys ru4.map.gz
         ( Да ? )
 
 Просьба: я знаю, что man keymaps и я узнаю о формате файла ru4.map.gz, но может
 у кого-то есть какая-то дока по этому формату в электронном варианте на русском
 языке или, по крайней мере, более понятными словами, то киньте, пожалуйста в
 меня - буду признателен. :)
 FIDO (русскоязычное и обычное) обменивается информацией в какой кодировке
 cp866?
 P. S. А почему тогда MS придумали ещё и win-кодировку символов для консольный
 приложений? Чтобы соблюсти авторские права (типа это самая наша кодировка)?
                                                С уважением Andrey...
 E-mail: commonbox@mailru.com                        ICQ: 77045318
 ... И ветер, Вечный ветер, Уносящий печали былых времен... (с)Сергей Жемайтис
 --- GoldED+/386 1.1.4.5 Сейчас 15:37, но это ещё не поздно. :)
  * Origin: ...seeking after the silence. (2:464/910.3)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 кодировки   Andrey Andreew   11 Feb 2001 18:01:03 
 Re: кодировки   Stepan Koltsov   11 Feb 2001 22:26:44 
 кодировки   Vadim Kutchin   13 Feb 2001 17:02:20 
Архивное /ru.linux/27603a869b5d.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional