Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Artem Chuprina                       2:5020/371.32  18 Aug 2000  19:16:34
 To : machulsk@oxiris.net
 Subject : Re: XML::Parser
 -------------------------------------------------------------------------------- 
 
 >> mon> а перловому парсеру XML::Parser реально дешевым способом
 >> mon> мозг вкрутить, чтоб он не говорил на русские буквы в
 >> mon> #PCDATA, что это
 >> mon> "not well-formed at line 4, column 10, byte 68"
 >> mon> ????
 >> 
 >> mon> русские буквы - не юникод а Win1251
 >> 
 >> Реально. Если документ начинается с
 >> 
 >> <?xml ... charset="windows-1251"?>
 
 mon> syntax error at line 1, column 22, byte 22 at 
 mon> /usr/local/lib/perl5/site_perl/5.6.0/i686-linux/XML/Parser.pm line 185
 
 mon> во каково! :-)
 
 Вру, не charset, а encoding. Самому ломы было в стандарт глянуть?
 
 mon> на самом деле, при помощи  
 
 mon> $theParser->parsefile( $self->{FileName},  ProtocolEncoding => "koi8-r"
 mon> )
 mon>                                             ^^^^^^^^^^^^^^^^^^^^^^^^^^
 
 mon> оно все на ура лечится, только в функцию
 mon> Char (в смысле в то, что повешено на этот parsing event)
 mon> передается не текст в кодировке win1251,
 mon> а unicode.
 
 mon> а я про него знать ничего не хочу, а надо чтобы 
 mon> AS-IS было т.е. считали KOI8 - отдали мне koi8, 
 mon> считали win1251 - отдали win1251/
 
 mon> как позвать парсер или что там сделать с текстом, вваливающимся в 
 mon> parsing event чтобы все круто было?
 
 Повесь там в трубу то, что надо из Unicode::Map8.
 
 >> Там еще README* лежит. Он, правда, несколько устарел, и имя одного из двух
 >> скриптов там написано неправильно, но имя модуля, который надо ставить -
 >> правильно, и этой информации достаточно. Hу разве что еще придется на
 >> ftp.unicode.org сообразить, где там лежать соответствующие таблицы, для этих
 >> двух кодировок они лежат в разных местах...
 mon> не в readme все нормально написано.
 mon> по крайней мере понятно что делать.
 
 Что я, собственно, и сказал. Hеправильно, но понятно.
 
 -- 
 Счастливо!
   Ран.
 --- ifmail v.2.14.os-p7-tma3
  * Origin: MemoNet (2:5020/371.32@fidonet)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: XML::Parser   Artem Chuprina   18 Aug 2000 19:16:34 
Архивное /ru.perl/17121b457f9b1.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional