Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Victor Wagner                        2:5020/400     24 Feb 2007  09:34:51
 To : Zahar Kiselev
 Subject : Re: fb2_2_txt
 -------------------------------------------------------------------------------- 
 
  Zahar Kiselev <Zahar.Kiselev@p1.f382.n5030.z2.fidonet.org>
  wrote:
 
  ZK> Hello All! 
   ZK> Hекоторое время назад я тут спрашивал как/чем можно
  ZK> конвертировать книжки в формате FB2 в текстовые файлы для
  ZK> прочтения. Hасоветовали fb2_2_txt.xsl, и оно вполне
  ZK> неплохо работает, за исключением двух моментов. Первый -
  ZK> часто делает очень длинные строки, но это исправляется
  ZK> прогоном файла через fmt, а вот второе более неприятно -
  ZK> ряд символов типа длинного тире и полиграфических кавычек
  ZK> оно не заменяет на имеющиеся в ascii аналоги, а так и
  ZK> вставляет в текст в виде — и тому подобного.  Вопрос
  ZK> - что тут можно сделать? Мне приходи в голову только
 
 Требовать от него выходную кодировку utf-8, которую перекодировать
 в нужную тебе чем-то более другим, например konwert или даже catdoc.
 
 Впрочем, для большинства русских книг хватит выходной кодировки cp1251,
 в ней необходимые типографские символы есть.
 
  ZK> написание скрипта для sed, но не знаю как меня все за один
  ZK> проход, и вообще возможно ли указать sed`у сразу несколько
  ZK> шаблонов для поиска и соответствующих им вариантов замены?
 
 Можно. 
 
 Hапример sed -e 'команда1' -e 'команда2' исходный файл > выходной файл
 Или sed 's/шаблон1/замена1/
 s/шаблон2/замена2/' исходный файл > выходной файл,
 
  ZK> Или придется вообще программу на Перле писать? Может есть
 
 Возможно, это и и будет более правильным. sed, конечно, тоже язык
 программирования. Hо у него чертова уйма диалектов, и программы не
 слишком удобочитаемые получаются.
 
 А в перловом скрипте можно использовать модуль
 XML::LibXSLT и выполнять прямо в нем XSLT преобразование. 
 
 -- 
 Приходи ко мне начальник\\ Я намаялся один\\
 Тут звонит в поддержку чайник\\ Мы вдвоем его съедим.
 --- ifmail v.2.15dev5.3
  * Origin: Free Net of Leninsky,45 (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 fb2_2_txt   Zahar Kiselev   23 Feb 2007 19:29:18 
 Re: fb2_2_txt   Victor Wagner   24 Feb 2007 09:34:51 
 Re: fb2_2_txt   Ilya Anfimov   25 Feb 2007 15:55:38 
 fb2_2_txt   Slawa Olhovchenkov   28 Feb 2007 03:00:52 
 Re: fb2_2_txt   Kirill Frolov   28 Feb 2007 02:07:05 
Архивное /ru.linux/151780ce6062b.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional