Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Vladimir Volkov                      2:5020/400     22 Nov 2005  18:37:35
 To : All
 Subject : HTML::Tree и utf-8 (Perl 5.6)
 -------------------------------------------------------------------------------- 
 
 Hello, All.
 
 HTML-страница парсится при помощи
 HTML::TreeBuilder. Исходный код страницы - в
 UTF-8. Есть две проблемы:
 1) не-ASCII символы в исходном тексте
 обрабатываются некорректно (режутся на два
 символа), что видно при последующем выводе
 обработанной страницы;
 2) не-ASCII символы, заданные как entities, при
 выводе as_text() кодируются в ANSI, а не в UTF-8.
 
 Как бы научить его нормально работать с UTF?
 
 -- 
   Vladimir Volkov, at your service
 Отправлено через сервер Форумы@mail.ru - http://talk.mail.ru
 --- ifmail v.2.15dev5.3
  * Origin: Talk.ru (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 HTML::Tree и utf-8 (Perl 5.6)   Vladimir Volkov   22 Nov 2005 18:37:35 
Архивное /ru.perl/64881f3d6589.html, оценка 3 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional