|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : vitus@ice.ru 2:5020/400 10 Jan 2002 18:44:00 To : Oleg Goodyckov Subject : Re: UTF-8 -------------------------------------------------------------------------------- Oleg Goodyckov <og@videoproject.kiev.ua> wrote: >> Проблема тут даже не в несоответствии моделей разметки. Проблема в том, >> что в вордовых файлах крайне редко встречается осмысленная разметка. >> Т.е. как обычно PEBKC. Hа том компьютере, где этот вордовый файл >> делался. OG>Я, конечно, не знаю предмета (внутреннего устройтсва вордовских файлов), OG>но позволь поделиться идеей. OG>Есть такая программулина (точнее, программище) greenstone (www.gsdl.org). OG>Это - коллектор документов. Оно собирает в себе документы в разных форматах OG>(и вордовском тоже). Так вот, если я правильно понял, все файлы сложных OG>форматов (ворд, пдф) они преобразуют в хтмл и так хранят. OG>Добавлю сюда еще ту примечательную стремительность, с которой МС воспылала OG>к ХМЛ любовью и решила все нафиг перевести на рельсы ХМЛ и жить только в Что-то мне не очень в это верится, Это обещали еще в Office 2000, но там этого почему-то не случилось. OG>нем. OG>Сюда же. Как известно, хтмл есть подмножество ХМЛ. Как известно, хтмл есть приложение SGML, а не XML. Вот XHTML - другое дело. OG>Зная, хоть и поверхностно, ХМЛ, рискну утверждать, что означенный путь - В силу предыдущей цитаты в это я поверить не могу. Вообще же проблема не в том, что нельзя извлечь из Word-а разметку. Извлечь ее можно. Проблема в том, что эта разметка бессмыслена для чего либо кроме как для печати оного документа, причем только на том компьютере, где он набирался - играют роль и набор шрифтов, и параметры установленного принтера. В Word-е можно сделать документ с осмысленной разметкой. Hо увы, на курсах класса "Освой MS-Office за 21 день" этому не учат. Равно как и не учат тому, что Excel это не только и не столько средство для рисования красивых табличек, сколько средство для обработки слабоформализованных числовых данных. Поэтому, если текст набранный в ворде теряет заметную часть информации при обрабокти wvWare, я сразу начинаю подозревать, что ценной информации в нем вообще не было. -- Victor Wagner vitus@ice.ru Chief Technical Officer Office:7-(095)-748-53-88 Communiware.Net Home: 7-(095)-135-46-61 http://www.communiware.net http://www.ice.ru/~vitus Отправлено через сервер Talk.Ru - http://www.talk.ru --- ifmail v.2.15dev5 * Origin: Talk.Ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/64881e992d97.html, оценка из 5, голосов 10
|