|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Oleg Machulski 2:5020/400 18 Aug 2000 15:23:30 To : All Subject : Re: XML::Parser -------------------------------------------------------------------------------- Artem Chuprina wrote: > > mon> а перловому парсеру XML::Parser реально дешевым способом > mon> мозг вкрутить, чтоб он не говорил на русские буквы в > mon> #PCDATA, что это > mon> "not well-formed at line 4, column 10, byte 68" > mon> ???? > > mon> русские буквы - не юникод а Win1251 > > Реально. Если документ начинается с > > <?xml ... charset="windows-1251"?> syntax error at line 1, column 22, byte 22 at /usr/local/lib/perl5/site_perl/5.6.0/i686-linux/XML/Parser.pm line 185 во каково! :-) на самом деле, при помощи $theParser->parsefile( $self->{FileName}, ProtocolEncoding => "koi8-r" ) ^^^^^^^^^^^^^^^^^^^^^^^^^^ оно все на ура лечится, только в функцию Char (в смысле в то, что повешено на этот parsing event) передается не текст в кодировке win1251, а unicode. а я про него знать ничего не хочу, а надо чтобы AS-IS было т.е. считали KOI8 - отдали мне koi8, считали win1251 - отдали win1251/ как позвать парсер или что там сделать с текстом, вваливающимся в parsing event чтобы все круто было? > mon> в каталоге XML/Parser/Encodings > mon> лежат какие-то бинарники, сгенеренные при помощи XML::Encoding. > > mon> но Win1251 там нет, равно как и koi8-r все больше японство какое-то. > > mon> где эти map-ы надыбать можно для родных нашему сердцу кодировок? > > Там еще README* лежит. Он, правда, несколько устарел, и имя одного из двух > скриптов там написано неправильно, но имя модуля, который надо ставить - > правильно, и этой информации достаточно. Hу разве что еще придется на > ftp.unicode.org сообразить, где там лежать соответствующие таблицы, для этих > двух кодировок они лежат в разных местах... не в readme все нормально написано. по крайней мере понятно что делать. -- mailto:shtein@high.ru ICQ#:33833712 http://www.geocities.com/SiliconValley/Network/7671/ --- ifmail v.2.15dev5 * Origin: Demos online service (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/4565b4d1a25e.html, оценка из 5, голосов 10
|