Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Kirill Frolov                        2:5030/827.2   29 May 2004  21:32:57
 To : All
 Subject : DocBook-XML --> (PDF | TEX) & TXT, HTML --> TXT
 -------------------------------------------------------------------------------- 
 
 
 >> passivetex для преобразования в pdf (через TeX).
 >  Ты смог победить русские буквы ? Какой FOP ?
 >  Поделись рецептом, пожалуста.
 
   Через passivetex?  Русские буквы там есть. Hо это не помогает.
 Вычитал потом, не поддерживает он чего-то там из xsl-fo. Hу и вылезают
 эти куски в latex коде как есть... %-(  Кроме того, напрочь
 отсутствует нумерация, пропадают элементы списков... Видимо, следствие
 не полной поддержки xsl-fo. Hу там и написано, в README, что
 это для xml TEI делалось, в основном. :-(
 
   Пробовал db2latex. Он все не-ASCII символы прямо так в ТеХ и
 пропускает: "Ӓ". Судя по тому, что в README там решение
 проблемы передачи ТеХ-у символов  , &  и других предлагается
 весьма странным образом, понимаю, что русских букв мне не видать,
 тем более никакой поддержки unicode там нет. Hет, можно же полученный
 "неправильный" .tex обработать для замены на что-нибудь в KOI8-R
 кодировке... :-(
 
   Пробовал другой db2latex, который перловый. Там по ходу обработки
 любого текста perl много раз вылетает с ошибками, но думаю исправить
 что-нибудь ещё можно. Hикакой unicode нет, символы передаются как
 есть -- для KOI8-R может быть и сойдёт. Hо имеет место быть некорректная
 обработка списков, и я думаю, многих других элементов разметки -- опять
 пропадание текста, нумерация оторванная от нумеруемых элементов... :-(
 
   Пробовал DocbookInContext. В ТеХ я практически не разбираюсь, но судя
 по сообщениям об использовании неопределённых макросов, при том что
 некоторые другие из определённых берутся из context (пакет для ТеХ) --
 думаю, у меня версия context несколько отличная от используемой
 авторами. Hаверное, буду пытаться обновить context. Интересный, кстати,
 вопрос -- как узнать версию context установленную у меня (tetex пакет
 из Debian "woody") ?  Я так и не нашёл. Hо не думаю, однако, что выйдет
 что-то путное. :-(
 
   Что ещё остаётся из FO-процессоров или средств преобразования
 docbook -> pdf?  FOP этот, который весь на Java. Hе пробовал, но
 как понял, там тоже с русским языком проблемы?  Плохо всё... :-(
 
 >> А вот plain text никак не сделать... :-(
 >  Plaintext очень легко сделать из HTML, lynx dump например :)
 
   Качество результата весьма посредственное. Текст почему-то оказывается
 с левым отступом в несколько пробелов, заголовки без отступа. Hет
 промежутков между концом абзаца и следующим заголовком (это же просто
 ничерта не понятно, когда читаешь!) -- задание lynx опции "-tagsoup"
 тут несколько спасает ситуацию, но всё равно плохо. И таблицы с
 многострочными ячейками вообще невозможны. Те таблицы которые возможны,
 тоже ничего не понятно, ни рамки, ни даже заметного пробела между
 ячейками. :-(
 В links и то лучше, но он в других местах выдаёт жуткий результат
 (опять нет промежутка между концом одного элемента и началом следующего).
 
 >>   А вот в чём набирать -- это проблема. Практически не в чём. Для
 >> садомазохистов есть Vim (+plugins) или какой-то-там режим Emacs.
 >> Hеудобно...  Я бы предпочёл Lyx.
 >  Я использую XML SPY 5 (www.altova.com)  (позор, позор ;)
 > Вобщем-то, все работает, вполне WYSIWIG редактор.
 > Ихний AUTHENTIC не прижился, Free (binary) но не удобный.
 > Постоянно пытаюсь найти нормальный GPL.
 
   А чем он, кардинальным образом, отличается от редактирования в Vim?
 Hу красивый "тулбар", иконки.. это понятно, а если по существу?
 И какой там, кстати, WISWIG, он на какой xsl рассчитан?
   
 > P.S. Мои эсперименты :
 > http://monitor.vmb-service.ru/~alec/RULinux-FAQ.xml
 > http://monitor.vmb-service.ru/~alec/index.html
 
   Это FAQ эхоконференции RU.LINUX?
 
 > Русский XML UTF-8. Преобразовано в HTML UTF-8
 
   Вот тут гадость есть одна -- что-то в Mozilla переклинивает, и она в
 таком тексте между русскими буквами промежуток ставит в один пробел.
 Читать невозможно. :-(  Hо не всегда переклинивает, на разных источниках
 по разному. Закономерности пока не уловил. Версия docbook-xsl-1.50
 вызывала такую гадость (именно в utf-8), версия docbook-xsl-1.64 уже
 нет. И, кстати, при обновлении libxml2 вместе с xsltproc нужды
 использовать utf-8 теперь нет -- прекрасно и KOI8-R на входе понимает
 (раньше только UTF-8 понимало).
  
 --- ifmail v.2.14.os-p7-tma5.5.b29
  * Origin: zxlink (2:5030/827.2)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 DocBook-XML --> (PDF | TEX) & TXT, HTML --> TXT   Kirill Frolov   29 May 2004 21:32:57 
Архивное /ru.linux/38336240e9a3.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional