Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Oleg Machulski                       2:5020/400     18 Aug 2000  15:23:30
 To : All
 Subject : Re: XML::Parser
 -------------------------------------------------------------------------------- 
 
 
 
 Artem Chuprina wrote:
 
 > 
 > mon> а перловому парсеру XML::Parser реально дешевым способом
 > mon> мозг вкрутить, чтоб он не говорил на русские буквы в
 > mon> #PCDATA, что это
 > mon> "not well-formed at line 4, column 10, byte 68"
 > mon> ????
 > 
 > mon> русские буквы - не юникод а Win1251
 > 
 > Реально. Если документ начинается с
 > 
 > <?xml ... charset="windows-1251"?>
 
 syntax error at line 1, column 22, byte 22 at 
 /usr/local/lib/perl5/site_perl/5.6.0/i686-linux/XML/Parser.pm line 185
 
 во каково! :-)
 на самом деле, при помощи  
 
 $theParser->parsefile( $self->{FileName},  ProtocolEncoding => "koi8-r"
 )
                                             ^^^^^^^^^^^^^^^^^^^^^^^^^^
 
 оно все на ура лечится, только в функцию
 Char (в смысле в то, что повешено на этот parsing event)
 передается не текст в кодировке win1251,
 а unicode.
 
 а я про него знать ничего не хочу, а надо чтобы 
 AS-IS было т.е. считали KOI8 - отдали мне koi8, 
 считали win1251 - отдали win1251/
 
 как позвать парсер или что там сделать с текстом, вваливающимся в 
 parsing event чтобы все круто было?
 > mon> в каталоге XML/Parser/Encodings
 > mon> лежат какие-то бинарники, сгенеренные при помощи XML::Encoding.
 > 
 > mon> но Win1251 там нет, равно как и koi8-r все больше японство какое-то.
 > 
 > mon> где эти map-ы надыбать можно для родных нашему сердцу кодировок?
 > 
 > Там еще README* лежит. Он, правда, несколько устарел, и имя одного из двух
 > скриптов там написано неправильно, но имя модуля, который надо ставить -
 > правильно, и этой информации достаточно. Hу разве что еще придется на
 > ftp.unicode.org сообразить, где там лежать соответствующие таблицы, для этих
 > двух кодировок они лежат в разных местах...
 
 не в readme все нормально написано.
 по крайней мере понятно что делать.
 -- 
 mailto:shtein@high.ru                  ICQ#:33833712
 http://www.geocities.com/SiliconValley/Network/7671/
 --- ifmail v.2.15dev5
  * Origin: Demos online service (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: XML::Parser   Oleg Machulski   18 Aug 2000 15:23:30 
 Re: XML::Parser   Paul Kulchenko   18 Aug 2000 18:53:00 
Архивное /ru.perl/4565b4d1a25e.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional