Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Andrey Sapozhnikov                   2:5020/400     11 Aug 2004  14:00:08
 To : Serge Chervjakov
 Subject : Re: регэкспы
 -------------------------------------------------------------------------------- 
 
 Serge Chervjakov пишет:
 
 > Wed Aug 11 2004 10:57, Dmitriy Zverev wrote to All:
 > 
 >  DZ> Чё-то я не пойму как правильно выцепить русское слово \w* или \W*.
 >  DZ> Если можно поподробней...
 > 
 > Я так думаю perldoc locale:)).
 > Hу а если только слово, то думаю /(?:^| )([А-Яё]+)(?: |$)/ или же просто
 > /\b([А-Яё]+)\b/ - и то и то "на коленочке" придумовалось, но думаю принцип
 > ясен?:)
 
 А кто сказал, что в данной кодировке буквы (за исключением 'ё' идут
 последовательно)?
 А что, слово после которого стоит знак препинания (точка, запятая и т.д. - в
 русском
 языке они не отбиваются пробелом) уже не слово (для первого варианта выражения)?
 Если только вас под дулом револьвера не принуждают к использованию древних
 версий perl, я бы рекомендовал привыкать к новым правилам хорошего тона:
 
 #!/usr/bin/perl -w
 use 5.8.0;
 use encoding 'koi8-r'; # Или в какой там ещё кодировке вы предпочитаете
                         # видеть константы в теле скрипта?
 my $line = 'Раз два, три. АБ23 ГОСТ-1999 Just an example.';
 print "Matched: $_\n" foreach $line =~ /\b(\p{Cyrillic}+)\b/g;
 
 -- 
 Андрей
 --- ifmail v.2.15dev5.3
  * Origin: Demos online service (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 регэкспы   Serge Chervjakov   11 Aug 2004 12:22:31 
 Re: регэкспы   Andrey Sapozhnikov   11 Aug 2004 14:00:08 
 Re: регэкспы   Serge Chervjakov   11 Aug 2004 18:20:52 
Архивное /ru.perl/65777b7c3caa.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional