|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Zahar Kiselev 2:5030/382.1 08 Jan 2002 02:39:32 To : Denis Smirnov Subject : Re: UTF-8 -------------------------------------------------------------------------------- Jan 07 23:28 02, Denis Smirnov wrote to Zahar Kiselev: DS>>> Кроме того utf-8 сейчас уже становится стандартом de-facto. ZK>> Если говорить именно о _de-facto_, то стандартом является тот вариант ZK>> юникода, ZK>> который используется в микрософтовском офисе. А там какой-то другой:( DS> Сходи на unicode.org, тогда всё поймёшь. Если совсем упрощённо: есть DS> UCS-4 DS> -- четырёхбайтна кодировка. Есть UCS-2 -- двухбайтная, содержит в DS> себе DS> часть UCS-4. В диапазоне 0x0000-0xFFFF они совпадают. Это кодировки. DS> Есть DS> представления этих кодировок, например UTF-8, UTF-16. Каждое из этих DS> представлений _алгоритмически_ (а не по каким-либо таблицам) DS> приводится к DS> юникоду. Мелкософт использует и UTF-16, и UTF-8. От понимания сути различий не становится легче ввиду самого факта существования этих различий. Все равно нужны перекодировщики - только теперь для преобразования между "разными представлениями". В идеале хотелось бы иметь не только одну и ту же кодировку(юникод как наиболее "продвинутую"), а и одинаковое представление этой кодировки на разных машинах - как мимниум под виндами и под линуксом - чтобы можно было переносить файлы без всякого преобразования. ZK>> К сожалению - при этом возникает та же проблема, что и с ZK>> использованием кои8 ZK>> или любой другой малораспространенной кодировки - невозможность ZK>> прямого обмена ZK>> файлами с другими машинами. Если перекодировкщик из КОИ8 еще реально ZK>> найти под ZK>> системой, отличной от Линукса, то чем перекодировать из юникода или ZK>> чем его ZK>> смотреть под виндами, если это не тот юникод, который используется ZK>> микрософтом? DS> Тот же он, тот же. Тот же, да не совсем. Представление-то другое(двухбайтное как я понимаю). Во всяком случае внутри файлов от ms-офиса. А где ты у MS видел именно UTF-8, аналогичный линуксовому? ZK>> Данная проблема не возникает у тех, кто обменивается по большей части ZK>> печатными ZK>> документами, но я и мои приятели уже давно практически не пользуются ZK>> принтерами ZK>> в процессе своей деятельности. Основная причина - быстрое захламление ZK>> рабочего ZK>> пространства макулатурой... Поэтому печатается только то, что ZK>> _обязательно_ ZK>> должно существовать в бумажном виде. DS> Разумеется. Или, при отсутствии PDA -- то, что будет читаться вдали DS> от компа. С уточнением - согласен. Zahar --- Msged/LNX 6.1.0 * Origin: undefined location (2:5030/382.1) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/32883c39e458.html, оценка из 5, голосов 10
|