|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Fedor Zuev 2:5070/156.89 28 Aug 2002 03:27:24 To : Anton Kovalenko Subject : Re: [JT] Hекоторые впечатления о <FOO Bar> Linux -------------------------------------------------------------------------------- .RFC-X-Complaints-To: usenet@bearloga.home .RFC-NNTP-Posting-Date: Tue, 27 Aug 2002 18:27:25 +0000 (UTC) .RFC-In-Reply-To: <87u1lrrbhj.fsf@lenin.doma.net> <87u1lrrbhj.fsf@lenin.doma.net> On Mon, 19 Aug 2002, Anton Kovalenko wrote to Fedor Zuev: FZ>> Hе в этом дело. Идеология utf-8, насколько я понимаю, FZ>> сводится к тому, что текст - это теперь не просто FZ>> последовательность байт-символов, а некая сложная структура, FZ>> которую еще надо интерпретировать. То есть, в отличии от FZ>> обычного текста шаг вправо, шаг влево - и у нас проблемы с FZ>> чтением. Множество вещей очень простых (настолько простых, что FZ>> даже не фиксируются сознанием как отдельная задача) при работе FZ>> с 8-bit ASCII, становятся нетривиальными в utf-8. Через что мы FZ>> будем иметь грабли на каждом шагу и всю дорогу. IMHO. Особенно FZ>> в юниксе, где понятие "текст" и "поток данных" не разделены. AK>IMHO, ты не там видишь проблему. Многобайтные кодировки и AK>stateful encodings не вчера появились -- они давно AK>используются там, где без них не обойтись. Поэтому работа AK>софтины только с "8-bit ASCII" (кстати, 8bit ASCII -- это либо AK>оксюморон, либо намёк на latin1, но уж никак ни KOI8-R) -- AK>глюк, который нужно исправлять. Точно так же, как исправляли AK>когда-то софт, привыкший к 7-bit ASCII. Есть такое понятие для программ "8-bit clean". то есить программа не интерпретирует восьмибитный текст в соответствии с локалью - но и не корежит его при преобразованиях. Hасколько я понимаю, для utf-8 такое невозможно, программа _должна_ проинтерпретировать весь текст в соответствии с текущей локалью уже для того, чтобы просто прочитать его, найти следующий символ. AK>И положительные сдвиги есть. Даже ncurses уже более-менее AK>допинали; только вот readline (и некоторые её аналоги) ещё AK>сопротивляются. "Даже" ncurses, как бы, малоинтересно. Это сугубо уровень ввода-вывода, я говорю не о нем. л --- pine 4.33 * Origin: ига лежит в кармане последним оружием дурако (2:5070/156.89@fidonet) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/17604ddf269a1.html, оценка из 5, голосов 10
|