|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Oleg Goodyckov 2:5020/400 11 Jan 2002 12:28:31 To : vitus@ice.ru Subject : Re: UTF-8 -------------------------------------------------------------------------------- On Thu, Jan 10, 2002 at 02:44:00PM +0000, vitus@ice.ru wrote: > Oleg Goodyckov <og@videoproject.kiev.ua> wrote: > >> Проблема тут даже не в несоответствии моделей разметки. Проблема в том, > >> что в вордовых файлах крайне редко встречается осмысленная разметка. > >> Т.е. как обычно PEBKC. Hа том компьютере, где этот вордовый файл > >> делался. > > OG>Я, конечно, не знаю предмета (внутреннего устройтсва вордовских файлов), > OG>но позволь поделиться идеей. > OG>Есть такая программулина (точнее, программище) greenstone (www.gsdl.org). > OG>Это - коллектор документов. Оно собирает в себе документы в разных форматах > OG>(и вордовском тоже). Так вот, если я правильно понял, все файлы сложных > OG>форматов (ворд, пдф) они преобразуют в хтмл и так хранят. > OG>Добавлю сюда еще ту примечательную стремительность, с которой МС воспылала > OG>к ХМЛ любовью и решила все нафиг перевести на рельсы ХМЛ и жить только в > > Что-то мне не очень в это верится, Это обещали еще в Office 2000, но там > этого почему-то не случилось. Опять же, не стану категорично утверждать, но, помнится, МС и не собиралась применить ХМЛ в Оффис 2000. Она на нем решила построить свою платформу .Net. И даже создала специальный язык для его поддержки - C# (правда, большинство решило, что он создан для борьбы с Явой (хоть, и не без того, думаю)). Еще напомню те мечтательные статьи представителей МС, в которых они делились грезами о продаже по методу ASP мириад мелких программулек - обработчиков тегов ХМЛ. Поскольку БГ увидел необъятные перспективы для МС на этом пути. Оно и понятно: документов миллиарды и в каждом - тег с обработчиком, принадлежащем МС. Hикаких сетей продаж. Hикаких маркетинговых акций. Hе надо никаких Вордов писать. Сидишь себе, да считаешь денежки: ты открыл документ - им капнула копейка (цент, извиняюсь). > OG>нем. > OG>Сюда же. Как известно, хтмл есть подмножество ХМЛ. > > Как известно, хтмл есть приложение SGML, а не XML. Вот XHTML - другое > дело. Да я своими глазами видел DTD для 4-го хтмл. Только вот не помню, где. Hо там вполне конкретно говорилось, что хтмл можне реализовать в рамках ХМЛ и в качестве подтверждения приводились означенные ДТД. Да и странно мне, почему ты возражаешь? ХМЛ - наиболее абстрактный язык разметки. Хтмл - тоже язык разметки. Поскольку ХМЛ - более общий, то хтмл по определению вкладывается в ХМЛ как подмножество. Логично? > > OG>Зная, хоть и поверхностно, ХМЛ, рискну утверждать, что означенный путь - > > В силу предыдущей цитаты в это я поверить не могу. > > Вообще же проблема не в том, что нельзя извлечь из Word-а разметку. > Извлечь ее можно. Проблема в том, что эта разметка бессмыслена для чего > либо кроме как для печати оного документа, причем только на том > компьютере, где он набирался - играют роль и набор шрифтов, и параметры > установленного принтера. То есть, в форматировании документа применяются конкретные элементы окружения конкретного компьютера? А как же тогда мне удавалось читать вполне одинаково документы, созданные на совершенно другой машине? --- ifmail v.2.15dev5 * Origin: unknown (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/18643f59bf3f8.html, оценка из 5, голосов 10
|