цКЮБМЮЪ ЯРПЮМХЖЮ


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Stepan Koltsov                       2:5049/1.118   12 Feb 2001  00:26:44
 To : All
 Subject : Re: кодировки
 -------------------------------------------------------------------------------- 
 
 Andrey Andreew <Andrey.Andreew@p3.f910.n464.z2.fidonet.org> wrote:
 
 > Ытак, какие существуют самые распространкнный на сегодня кодировки:
 > 1) win
 > 2) dos
 > 3) koi8
 > 4) скажем так: другие
 
 > Так вот, под какими псевдонимами известны эти кодировки?
 > Что такое cp866 (code page 866), alt (alternative), iso-8859-x, iso-8859-5,
 
 lat
 
 > (latine, latine1)
 
 cp866 = alt (альтернативная кодировка ВЪСТ)
 что такое iso* -- самому интересно
 
 Зачем из так много:
 
 cp866 давно придумали. Русские буквы идут  подряд с дыркой, буквы йк там
 нет. Ымеет замечательную особенность  (связанную с устройством vga), что
 в текстовой моде  русские буквы не совпадают  с продолжаемыми символами,
 посему до сих пор активно  используется. Усли интересно -- расскажу, что
 такое "продолжаемые символы" :)
 
 koi8-r замечательна тем, что 
 a) задекларена в RFC
 b) Усли на каждый символ в тексте сделать &= 0x7F (т. е. обнулить первый
 бит) останется читаемый текст
 Самая используемая кодировка в русских бесплатных юниксах.
 
 cp1251 -- там все буквы подряд идут :)
 
 Hафиг я вск это писал? :)
 
 > ╦, наверное несу ересь, т.к.
 > cp866 - это кодировка букв в консольном шрифте ( Та ? )
 
 В windows -- всегда, в linux -- как настроишь.
 
 >   Ы я, используя MS Windows, использую консольные шрифты в той самой code
 
 page
 
 > 866 ( Та ? ). ╗оэтому для отображения всей текстовой информации HУЖHЪ символы
 > ТУШСТЪВЪЗ ЫHЖЪРЩЯСЫЫ преобразовать в символы, соответствующие этому шрифту
 > (cp866)  ( ╗равильно я выразился ? ).
 
 > ТЪС приложения кодирую символы в т.н. dos-кодировке. Это значит, что функции
 > ввода, при вводе с клавиатуры, контролер клавиатуры возвращает некоторый код
 > символа, начертание которого и на кнопке клавиатуры и в cp866-консольном
 
 шрифте
 
 > - ЪТЫHЯШЪВЫ! ( Та ? )      Я консольный знакогенератор ТЪС приложений, в свою
 > очередь, получает коды символов от функций ввода В ТЯШЪЗ ЖУ ШЪТЫРЪВШУ. ( Та ?
 
 )
 
 > ╗оэтому пользователь счастлив и не думает о кодировках.
 
 > Яналогично и для Win-приложений и koi.
 > ╦ провкл ряд исследований с помощью Dos Navigator-а (для Dos) и выяснил
 > следующие любопытные факты:
 
 >> В koi-кодировке
 > русские символы расположены вместе и после символов псевдографики (сначала
 > маленькие, а потом большие)
 >> В ТЪС кодировке
 > русские буквы размещаются так:
 > "Я" - "╦" = 0xA0 - 0x9F
 > "а" - "п" = 0xA0 - 0xAF
 > "р" - "я" = 0xE0 - 0xEF
 >     Т.е. - полностью совпадают с кодировкой в самом шрифте. ЗЯ ЭТЪ -
 > ТЪС-кодировка - РУЭйЗ.
 >     Ыз этого выводы: cp866 - кодировка символов для dos приложений (самая что
 > ни на есть dos-кодировка) ( Та ? ),
 
 Это одно и  то же :) Тосовской cp866 кодировку  обозвали из-за того, что
 она используется в досе.
 
 > потому что при этом загруженом шрифте не требуется никаких транслирований
 > символов.
 >     ╗оэтому Cyrillic font в Linux-е ╗Ъ УЩЪЭЧЯHЫП и В СЯЩЫЬ РЯС╗РЪСТЯHйHHЫЬ
 > СЭУЧЯ╦Ь - это тот самый cp866-консольный фонт, с ТЪС кодировкой символов (я
 > имею
 > в виду, что именно такие фонты зашиты в дистрибутиве slakware 7.0)
 > ( Та ? )( Та ? )( Та ? )
 >     и называется она Alt - Alternative  (т.е. dos = alt ( Та ? ))
 >         > setfont alt-8x16.*
 
 >     Hо в Linux, на беду ;), используется, как правило koi8 кодировка для
 > хранения текстовых данных (по крайней мере ек советуют в howto, поэтому будем
 > считать, что она - native ( Та ? ))
 
 Та.
 
 > ╗оэтому при настройке русского в консоли для правильного вывода символов
 > используется on-line трансляция koi -> alt (dos):
 >           >  mapscrn koi2alt
 
 Ябсолютно верно.
 
 > Я вот вопрос (с этим ещк  не вполне разобрался): как настраивается тот
 > факт, что linux-программы хранят текстовые данные в koi кодировке?
 >    ╗од "хранят свои данные" я понимаю тот факт, что именно в этой
 > кодировке сохраняются даные, когда я их ввожу с клавиатуры.
 >     ╗редположительный ответ: потому, что я так запрограммировал ядровый (тот
 > что в ядре) линуховый драйвер клавиатуры:
 >         > loadkeys ru4.map.gz
 >         ( Та ? )
 
 Та :)
 
 > ╗росьба: я знаю, что man keymaps и я узнаю о формате файла ru4.map.gz,
 > но может у  кого-то есть какая-то дока по этому  формату в электронном
 > варианте  на  русском языке  или,  по  крайней мере,  более  понятными
 > словами, то киньте, пожалуйста в меня - буду признателен. :)
 
 Там IMHO вск очевидно. ╗осмотри внутрь, потыкай -- разберкшься.
 
 > FIDO (русскоязычное и обычное) обменивается информацией в какой кодировке
 > cp866?
 
 Та вроде.
 
 > P. S. Я почему тогда MS придумали ещк и win-кодировку символов для консольный
 > приложений? Чтобы соблюсти авторские права (типа это самая наша кодировка)?
 
 windows для  консольных приложений использует cp866  кодировку. Я cp1251
 придумалииз-за того, что она ровнее IMHO
 
 Тьфу, уходить пора. P. S. Я что ты про всякие Unicode и UTF-8 не спрашивал?
 
 -- 
 mailto: linuxrulit@pisem.net
 ICQ:    26521795
 
 ... Здесь может быть ваша реклама.
 +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
 + Gateway NEWS (http://in.kazan.ru) <=> FidoNet (2:5049/1)
 + of Kazan Physical-Technical Institute
 + ( http://kfti.knc.ru ; http://kazinfo.knc.ru )
 + 
 + User email address:   Stepan.Koltsov@p0.f1.n5049.z2.fidonet.org
 + User FidoNet address: 2:5049/1.
 --- NewsGate+ v0.8Р3
  * Origin: Kazan Physical-Technical Institute, Gateway NEWS  (2:5049/1.118)
 
 

бЕПМСРЭЯЪ Й ЯОХЯЙС РЕЛ, ЯНПРХПНБЮММШУ ОН: БНГПЮЯРЮМХЕ ДЮРШ  СЛЕМЭЬЕМХЕ ДЮРШ  РЕЛЮ  ЮБРНП 

 рЕЛЮ:    юБРНП:    дЮРЮ:  
 Re: кодировки   Stepan Koltsov   12 Feb 2001 00:26:44 
юПУХБМНЕ /ru.linux/3341057415e0.html, НЖЕМЙЮ 2 ХГ 5, ЦНКНЯНБ 10
ъМДЕЙЯ.лЕРПХЙЮ
Valid HTML 4.01 Transitional