|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : vitus@ice.ru 2:5020/400 08 Jan 2002 22:43:29 To : "Alec Voropay" Subject : Re: UTF-8 -------------------------------------------------------------------------------- Alec Voropay <alec@into.nit.spb.ru> wrote: AV>Zahar Kiselev wrote in message <1010426964@p1.f382.n5030.z2.ftn>... >>А вот тут - нет. Загляни глазами в файл от ворда - увидишь, что там не AV>UTF-8, а >>что-то другое. Хотя тоже юникод. И вот именно этот вариант является "самым >>распространенным"(по вполне понятным причинам). AV> То, что там на самом деле лежит внутри файлов ворда -- знает только AV>Microsoft. Во-первых, Microsoft этим знанием худо-бедно делится. Hа msdn формат 97 и выше ворда опубликован. Более ранние - зажаты. Hо на www.wotsit.org какая-то дока есть, и wvware.sf.net как-то работает. А вообще формат ворда достаточно легко понятен посредством просмотра его в при помощи xxd или mc-шного hex-viewer-а. Во всяком случае до версии 0.91 catdoc при написании ее никаких других источников информации не использовалось принципиально. Там идет последовательность 128-байтных блоков, каждый из которых содержит либо cp1252, либо ucs2-little-endian. -- Victor Wagner vitus@ice.ru Chief Technical Officer Office:7-(095)-748-53-88 Communiware.Net Home: 7-(095)-135-46-61 http://www.communiware.net http://www.ice.ru/~vitus Отправлено через сервер Talk.Ru - http://www.talk.ru --- ifmail v.2.15dev5 * Origin: Talk.Ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/6488544704a1.html, оценка из 5, голосов 10
|