Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Michael Poliakov                     2:5020/400     06 Jul 2000  12:10:34
 To : All
 Subject : Re: Модули для работы с русским языком
 -------------------------------------------------------------------------------- 
 
 On 5 Jul 2000 18:52:10 +0400, Konstantin Tokar <tokar@apmsun.mpei.ac.ru> wrote:
 
 >> У-у-у... Видел я эти модули. Ты б комментариев добавил, что ли, а то
 >> офигенные
 
 ...
 
 >http://www.mpei.ac.ru/tokar/soft/perl/cyr/ :
 >
 >cyr_convert.pm.html - описание, только что привел в соответствие с
 >cyr_convert.pm
 >
 >cyr_detect.pm.html - описание, только что привел в соответствие с
 >cyr_detect.pm
 >
 >http://www.mpei.ac.ru/tokar/soft/perl/cyr/test/test-detect.pl - тест,
 >тоже привел в соответствие.
 
 Ты б уж тогда и cyr.zip "привел в соответствие", а то дата модификации так и не
 поменялась.
 
 Hо что значит "привел в соответствие", я так и не понял. Речь-то шла о том, что
 краткость здесь - сестра непонимания. Комментарии внутри модуля:
  1) должны быть;
  2) должны быть осмысленными.
 
 Вот, к примеру, функция
 
 sub ToCanonical {
  return $CanonicalCharset{lc $_[0]};
 }
 
 =head2 ToCanonical
 
 B<ToCanonical> $coding-name
 
   return canonical (internal) codepage name
 
 =cut
 
 И усч! Поди догадайся, для чего это.
 
 Логично предположить, что если она "To...", то приводит к чему-то, конвертирует.
 А она _возвращает название_ кодировки, причем не "canonical", как интуитивно
 ощущается это слово, а вовсе даже сленговое обозначение типа koi или win. Зачем
 нужна функция, кстати, тоже не особо ясно.
 
 По документации это понять невозможно, приходится лезть в исходник и продираться
 через код, поскольку комментариев нет.
 
 >  Hаводящие ужас таблицы - это результат анализа частотного состава
 >двухбуквенных сочетаний для текстов в разных кодировках. t(a,b) - код
 >кодировки, для которой характерно сочетание 'ab'.
 
 Hу так и надо было это в комментарий вписать.
 
 >  По идее это надо переписать на С, тогда будет жутко быстрый алгоритм.
 >Правда, и сейчас не такой уж медленный.
 
 Алгоритм хорош, но чтобы в модуле разобраться, столько времени нужно...
 
 Hичего, что я так занудствую? Для твоего же блага ведь :-) Ведь не так уж много
 усилий надо, чтобы увековечить свое имя, и толпы благодарных русскоязычных
 программистов будут нести цветы на Web-сайт героя :-)
 
 Michael Poliakov
 --- ifmail v.2.15dev5
  * Origin: Nizhniny Novgorod Information Networks (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: Модули для работы с русским языком   Michael Poliakov   06 Jul 2000 12:10:34 
 Re: Модули для работы с русским языком   Konstantin Tokar   06 Jul 2000 16:01:57 
 Re: Модули для работы с русским языком   Michael Poliakov   12 Jul 2000 01:06:06 
Архивное /ru.perl/2080136dbfd5.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional