|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Andrey Sapozhnikov 2:5020/400 11 Aug 2004 14:00:08 To : Serge Chervjakov Subject : Re: регэкспы --------------------------------------------------------------------------------
Serge Chervjakov пишет:
> Wed Aug 11 2004 10:57, Dmitriy Zverev wrote to All:
>
> DZ> Чё-то я не пойму как правильно выцепить русское слово \w* или \W*.
> DZ> Если можно поподробней...
>
> Я так думаю perldoc locale:)).
> Hу а если только слово, то думаю /(?:^| )([А-Яё]+)(?: |$)/ или же просто
> /\b([А-Яё]+)\b/ - и то и то "на коленочке" придумовалось, но думаю принцип
> ясен?:)
А кто сказал, что в данной кодировке буквы (за исключением 'ё' идут
последовательно)?
А что, слово после которого стоит знак препинания (точка, запятая и т.д. - в
русском
языке они не отбиваются пробелом) уже не слово (для первого варианта выражения)?
Если только вас под дулом револьвера не принуждают к использованию древних
версий perl, я бы рекомендовал привыкать к новым правилам хорошего тона:
#!/usr/bin/perl -w
use 5.8.0;
use encoding 'koi8-r'; # Или в какой там ещё кодировке вы предпочитаете
# видеть константы в теле скрипта?
my $line = 'Раз два, три. АБ23 ГОСТ-1999 Just an example.';
print "Matched: $_\n" foreach $line =~ /\b(\p{Cyrillic}+)\b/g;
--
Андрей
--- ifmail v.2.15dev5.3
* Origin: Demos online service (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/65777b7c3caa.html, оценка из 5, голосов 10
|