|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Vladimir Volkov 2:5020/400 22 Nov 2005 18:37:35 To : All Subject : HTML::Tree и utf-8 (Perl 5.6) -------------------------------------------------------------------------------- Hello, All. HTML-страница парсится при помощи HTML::TreeBuilder. Исходный код страницы - в UTF-8. Есть две проблемы: 1) не-ASCII символы в исходном тексте обрабатываются некорректно (режутся на два символа), что видно при последующем выводе обработанной страницы; 2) не-ASCII символы, заданные как entities, при выводе as_text() кодируются в ANSI, а не в UTF-8. Как бы научить его нормально работать с UTF? -- Vladimir Volkov, at your service Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru --- ifmail v.2.15dev5.3 * Origin: Talk.ru (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/64881f3d6589.html, оценка из 5, голосов 10
|