|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Victor Wagner 2:5020/400 28 Nov 2002 19:58:32 To : Andrey Sapozhnikov Subject : Re: KOI2utf8 -------------------------------------------------------------------------------- Andrey Sapozhnikov <sapa@icb.chel.su> wrote: AS> Victor Wagner wrote: >> Andrey Sapozhnikov <sapa@icb.chel.su> wrote: >> >> AS> Я скромно напомню, что это все решения для версий perl < 5.8 ибо >> AS> 5.8 изначально имеет в поставке собственную поддержку чарсетов и >> AS> преобразований между ними, достаточно мощную и гибкую. Уже 4 с >> AS> половиной месяца - полет нормальный. Можно переставать бояться. >> >> И что, преобразование >> >> "\x2020Сегодня\xA0\x2014 Geschlo\xDFen" -> >> "†Сегодня — Geschlossen" сделает? >> >> Очень бы хотел посмотреть решение на 5.8 перле, которое при >> преобразовании в 8-битный чарсет позволяет вызывать свою функцию >> преобразования на все символы, отсутствующие в выходной перекодировке. >> >> В экран уместишь?' AS> Эээ... давай разберемся по-порядку. Во-первых, что это за строка No.1? AS> Она изначально в какой кодировке - в utf8? И как трактуются \xNNNN ? AS> Как chr(NN) . 'NN'? Ибо в perl уникодные символы в строке записываются Hу извини. Я слишком неопытен в работе с юникодом в перле, поэтому не написал там фигурных скобок. Я имел в виду: "\x{2020}Сегодня\x{A0}\x{2014} Geschlo\x{DF}en" Результат может быть в любой восьмибитной кодировке, в которой нет символов EM-DASH, BULLET и западно-европейских акцентированных букв. Hапример, в кои-8. С неразрывным пробелом там призовая игра, ибо он в кодировки есть. AS> как \x{NNNN}. И в какой кодировке Вы хотите результат? Ибо то, что AS> я вижу вообще не есть перекодировка чарсетов. Согласен. Это гораздо более практически полезная задача ПРЕДСТАВЛЕHИЯ строки, которая легко и естественно представляется в юникоде, средствами 8-битной кодировки + HTML. Буде будет такое решение, я, естественно, попробую адаптировать его к другим языкам, которые позволяют средставми 8-битной кодировки выразить более другие символы - TeX, Perl, Tcl. Если сложность адаптации будет соответствовать прямизне представления этих символов в более другом языке, сделаю вывод, что в 5.8 перле работа с кодировками сделана УДОБHО. -- http://www.communiware.ru http://www.ice.ru/~vitus --- ifmail v.2.15dev5 * Origin: Leninsky 45 home network (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/15178ecd705d4.html, оценка из 5, голосов 10
|