|
|
ru.unix.bsd- RU.UNIX.BSD ------------------------------------------------------------------ From : Dmitrij Lystsov 2:5020/400 26 Jul 2006 14:34:48 To : All Subject : html to txt? -------------------------------------------------------------------------------- Привет всем! Столкнулся с задачей переделывания _большого_ HTML файла в обычный текст. Взял textproc/html2text Все бы хорошо, но либо файл кривой, либо конвертатор так срабатывает. Я больше склоняюсь к кривому файлу ... В некоторых словах произходит удвоение одних и тех же букв, например слово HАЧИСЛЕHИЕ преобразуется в HА АЧ ЧИ ИСЛЕ ЕHИ ИЕ А между буквами пробелы (в винде это квадратики :) Что посоветуете? -- Чем больше узнаю, тем больше понимаю, что ни чего не знаю ... Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru --- ifmail v.2.15dev5.3 * Origin: Talk.Mail.Ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix.bsd/6488105036ac.html, оценка из 5, голосов 10
|