|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Victor Wagner 2:5020/400 24 Feb 2007 09:34:51 To : Zahar Kiselev Subject : Re: fb2_2_txt -------------------------------------------------------------------------------- Zahar Kiselev <Zahar.Kiselev@p1.f382.n5030.z2.fidonet.org> wrote: ZK> Hello All! ZK> Hекоторое время назад я тут спрашивал как/чем можно ZK> конвертировать книжки в формате FB2 в текстовые файлы для ZK> прочтения. Hасоветовали fb2_2_txt.xsl, и оно вполне ZK> неплохо работает, за исключением двух моментов. Первый - ZK> часто делает очень длинные строки, но это исправляется ZK> прогоном файла через fmt, а вот второе более неприятно - ZK> ряд символов типа длинного тире и полиграфических кавычек ZK> оно не заменяет на имеющиеся в ascii аналоги, а так и ZK> вставляет в текст в виде — и тому подобного. Вопрос ZK> - что тут можно сделать? Мне приходи в голову только Требовать от него выходную кодировку utf-8, которую перекодировать в нужную тебе чем-то более другим, например konwert или даже catdoc. Впрочем, для большинства русских книг хватит выходной кодировки cp1251, в ней необходимые типографские символы есть. ZK> написание скрипта для sed, но не знаю как меня все за один ZK> проход, и вообще возможно ли указать sed`у сразу несколько ZK> шаблонов для поиска и соответствующих им вариантов замены? Можно. Hапример sed -e 'команда1' -e 'команда2' исходный файл > выходной файл Или sed 's/шаблон1/замена1/ s/шаблон2/замена2/' исходный файл > выходной файл, ZK> Или придется вообще программу на Перле писать? Может есть Возможно, это и и будет более правильным. sed, конечно, тоже язык программирования. Hо у него чертова уйма диалектов, и программы не слишком удобочитаемые получаются. А в перловом скрипте можно использовать модуль XML::LibXSLT и выполнять прямо в нем XSLT преобразование. -- Приходи ко мне начальник\\ Я намаялся один\\ Тут звонит в поддержку чайник\\ Мы вдвоем его съедим. --- ifmail v.2.15dev5.3 * Origin: Free Net of Leninsky,45 (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/151780ce6062b.html, оценка из 5, голосов 10
|