|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : vitus@ice.ru 2:5020/400 08 Jan 2002 22:37:16 To : Denis Smirnov Subject : Re: linux and koi8-r -------------------------------------------------------------------------------- Denis Smirnov <mithraen@freesource.info> wrote: vir>> 2. Хотелось бы более гибкого поведения в случае, когда в выходной vir>> кодировке входной символ действительно не представим. vir>> см, например, как это сделано в catdoc. DS>Я об этом думал. И собирался написать свой перекодировщик (заодно привнеся DS>опыт, наработаный в DCplus -- автоматическое определение исходной кодировки DS>вещь весьма полезная нынче). Hо, видимо, с алгоритмикой у меня слабо. DS>Проблема в том, что делать поддержку UCS-2 уже как-то неразумно, надо UCS-4. DS>А код более-менее шустрого перекодировщика из UCS-4 в любую 8-и битную DS>кодировку я просто не представляю. Особенно с учётом того, что заменять надо DS>не код на символ, а код на группу символов (как для того же \copyright). При DS>этом делать Еще раз - см, как это сделано в catdoc. Там, правда, поддерживается UCS-2, но зато программа сделана в расчете на 16-битную систему. Hельзя, конечно, сказать, что ее производительность на 286/12MHz меня устраивала (а именно такой была система, на которой была написана основная часть catdoc-0.90) DS>надо разные варианты отображения неперекодируемых символов. То-есть (с) может DS>выглядеть как (с), и как \copyright. Причём надо учитывать, что это делается DS>не только для русских кодировок, но это потом могут и какие-нибудь китайцы DS>использовать, и база данных может быть действительно большой. Вот с китайцами у меня хуже. catdoc до сих пор не понимает не 8-битных выходных charset-ов. А "действительно большую базу данных" можно в чем-то типа dbm хранить. Озаботившись, естественно, кэшированием наиболее употребительных заменяющих последовательностей. -- Victor Wagner vitus@ice.ru Chief Technical Officer Office:7-(095)-748-53-88 Communiware.Net Home: 7-(095)-135-46-61 http://www.communiware.net http://www.ice.ru/~vitus Отправлено через сервер Talk.Ru - http://www.talk.ru --- ifmail v.2.15dev5 * Origin: Talk.Ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/6488dfade821.html, оценка из 5, голосов 10
|