|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Stepan Koltsov 2:5049/1.118 12 Feb 2001 00:26:44 To : All Subject : Re: кодировки -------------------------------------------------------------------------------- Andrey Andreew <Andrey.Andreew@p3.f910.n464.z2.fidonet.org> wrote: > Ытак, какие существуют самые распространкнный на сегодня кодировки: > 1) win > 2) dos > 3) koi8 > 4) скажем так: другие > Так вот, под какими псевдонимами известны эти кодировки? > Что такое cp866 (code page 866), alt (alternative), iso-8859-x, iso-8859-5, lat > (latine, latine1) cp866 = alt (альтернативная кодировка ВЪСТ) что такое iso* -- самому интересно Зачем из так много: cp866 давно придумали. Русские буквы идут подряд с дыркой, буквы йк там нет. Ымеет замечательную особенность (связанную с устройством vga), что в текстовой моде русские буквы не совпадают с продолжаемыми символами, посему до сих пор активно используется. Усли интересно -- расскажу, что такое "продолжаемые символы" :) koi8-r замечательна тем, что a) задекларена в RFC b) Усли на каждый символ в тексте сделать &= 0x7F (т. е. обнулить первый бит) останется читаемый текст Самая используемая кодировка в русских бесплатных юниксах. cp1251 -- там все буквы подряд идут :) Hафиг я вск это писал? :) > ╦, наверное несу ересь, т.к. > cp866 - это кодировка букв в консольном шрифте ( Та ? ) В windows -- всегда, в linux -- как настроишь. > Ы я, используя MS Windows, использую консольные шрифты в той самой code page > 866 ( Та ? ). ╗оэтому для отображения всей текстовой информации HУЖHЪ символы > ТУШСТЪВЪЗ ЫHЖЪРЩЯСЫЫ преобразовать в символы, соответствующие этому шрифту > (cp866) ( ╗равильно я выразился ? ). > ТЪС приложения кодирую символы в т.н. dos-кодировке. Это значит, что функции > ввода, при вводе с клавиатуры, контролер клавиатуры возвращает некоторый код > символа, начертание которого и на кнопке клавиатуры и в cp866-консольном шрифте > - ЪТЫHЯШЪВЫ! ( Та ? ) Я консольный знакогенератор ТЪС приложений, в свою > очередь, получает коды символов от функций ввода В ТЯШЪЗ ЖУ ШЪТЫРЪВШУ. ( Та ? ) > ╗оэтому пользователь счастлив и не думает о кодировках. > Яналогично и для Win-приложений и koi. > ╦ провкл ряд исследований с помощью Dos Navigator-а (для Dos) и выяснил > следующие любопытные факты: >> В koi-кодировке > русские символы расположены вместе и после символов псевдографики (сначала > маленькие, а потом большие) >> В ТЪС кодировке > русские буквы размещаются так: > "Я" - "╦" = 0xA0 - 0x9F > "а" - "п" = 0xA0 - 0xAF > "р" - "я" = 0xE0 - 0xEF > Т.е. - полностью совпадают с кодировкой в самом шрифте. ЗЯ ЭТЪ - > ТЪС-кодировка - РУЭйЗ. > Ыз этого выводы: cp866 - кодировка символов для dos приложений (самая что > ни на есть dos-кодировка) ( Та ? ), Это одно и то же :) Тосовской cp866 кодировку обозвали из-за того, что она используется в досе. > потому что при этом загруженом шрифте не требуется никаких транслирований > символов. > ╗оэтому Cyrillic font в Linux-е ╗Ъ УЩЪЭЧЯHЫП и В СЯЩЫЬ РЯС╗РЪСТЯHйHHЫЬ > СЭУЧЯ╦Ь - это тот самый cp866-консольный фонт, с ТЪС кодировкой символов (я > имею > в виду, что именно такие фонты зашиты в дистрибутиве slakware 7.0) > ( Та ? )( Та ? )( Та ? ) > и называется она Alt - Alternative (т.е. dos = alt ( Та ? )) > > setfont alt-8x16.* > Hо в Linux, на беду ;), используется, как правило koi8 кодировка для > хранения текстовых данных (по крайней мере ек советуют в howto, поэтому будем > считать, что она - native ( Та ? )) Та. > ╗оэтому при настройке русского в консоли для правильного вывода символов > используется on-line трансляция koi -> alt (dos): > > mapscrn koi2alt Ябсолютно верно. > Я вот вопрос (с этим ещк не вполне разобрался): как настраивается тот > факт, что linux-программы хранят текстовые данные в koi кодировке? > ╗од "хранят свои данные" я понимаю тот факт, что именно в этой > кодировке сохраняются даные, когда я их ввожу с клавиатуры. > ╗редположительный ответ: потому, что я так запрограммировал ядровый (тот > что в ядре) линуховый драйвер клавиатуры: > > loadkeys ru4.map.gz > ( Та ? ) Та :) > ╗росьба: я знаю, что man keymaps и я узнаю о формате файла ru4.map.gz, > но может у кого-то есть какая-то дока по этому формату в электронном > варианте на русском языке или, по крайней мере, более понятными > словами, то киньте, пожалуйста в меня - буду признателен. :) Там IMHO вск очевидно. ╗осмотри внутрь, потыкай -- разберкшься. > FIDO (русскоязычное и обычное) обменивается информацией в какой кодировке > cp866? Та вроде. > P. S. Я почему тогда MS придумали ещк и win-кодировку символов для консольный > приложений? Чтобы соблюсти авторские права (типа это самая наша кодировка)? windows для консольных приложений использует cp866 кодировку. Я cp1251 придумалииз-за того, что она ровнее IMHO Тьфу, уходить пора. P. S. Я что ты про всякие Unicode и UTF-8 не спрашивал? -- mailto: linuxrulit@pisem.net ICQ: 26521795 ... Здесь может быть ваша реклама. +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ + Gateway NEWS (http://in.kazan.ru) <=> FidoNet (2:5049/1) + of Kazan Physical-Technical Institute + ( http://kfti.knc.ru ; http://kazinfo.knc.ru ) + + User email address: Stepan.Koltsov@p0.f1.n5049.z2.fidonet.org + User FidoNet address: 2:5049/1. --- NewsGate+ v0.8Р3 * Origin: Kazan Physical-Technical Institute, Gateway NEWS (2:5049/1.118) бЕПМСРЭЯЪ Й ЯОХЯЙС РЕЛ, ЯНПРХПНБЮММШУ ОН: БНГПЮЯРЮМХЕ ДЮРШ СЛЕМЭЬЕМХЕ ДЮРШ РЕЛЮ ЮБРНП
юПУХБМНЕ /ru.linux/3341057415e0.html, НЖЕМЙЮ ХГ 5, ЦНКНЯНБ 10
|