Главная страница


ru.unix.bsd

 
 - RU.UNIX.BSD ------------------------------------------------------------------
 From : Dmitrij Lystsov                      2:5020/400     26 Jul 2006  14:34:48
 To : All
 Subject : html to txt?
 -------------------------------------------------------------------------------- 
 
 Привет всем!
 Столкнулся с задачей переделывания _большого_ HTML файла в обычный текст.
 Взял textproc/html2text
 Все бы хорошо, но либо файл кривой, либо конвертатор так срабатывает.
 
 Я больше склоняюсь к кривому файлу ...
 
 В некоторых словах произходит удвоение одних и тех же букв, например 
 слово HАЧИСЛЕHИЕ преобразуется в HА АЧ ЧИ ИСЛЕ ЕHИ ИЕ
 А между буквами пробелы (в винде это квадратики :)
 
 Что посоветуете?
 -- 
 Чем больше узнаю, тем больше понимаю, что ни чего не знаю ...
 
 Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
 --- ifmail v.2.15dev5.3
  * Origin: Talk.Mail.Ru (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 html to txt?   Dmitrij Lystsov   26 Jul 2006 14:34:48 
 Re: html to txt?   Dmitry Karasik   26 Jul 2006 15:18:34 
 Re: html to txt?   Dmitrij Lystsov   26 Jul 2006 16:06:02 
 Re: html to txt?   Andrej A. Shidenko   26 Jul 2006 15:33:00 
Архивное /ru.unix.bsd/6488105036ac.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional