Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Artem Chuprina                       2:5020/400     06 May 2003  14:08:14
 To : "Serg Chervjakov"
 Subject : Re: Логика regexp'ов и вопрос по LWP
 -------------------------------------------------------------------------------- 
 
 Здравствуй, Serg Chervjakov.
 
 SC> По регэкспам. Hеобходимо составить регэксп, который бы мог обрабатывать
 SC> вложеные комментарии. Гы... ничего не понятно. Покажу на пример: есть текст:
 SC> ----
 SC> tratatatata
 SC> <!--mycomma
 SC>  this is very cool regexp
 SC> -->
 SC> end txt
 SC> ----
 SC> Hужно, по идентификатору "mycomma" выдрать внутреености этого комментария:
 SC> делаем регэксп:
 SC> ($rez)=$txt=~/<\!--mycomma(.*?)-->/; (пока ключ g не надо).
 SC> Думаю в $rez будет "this is very cool regexp" (ну смысл по крайней мере
 SC> понятен). А вот труба если в $txt лежит:
 SC> ----
 SC> tratatatata
 SC> <!--mycomma
 SC>  this is very cool regexp
 SC>  <!--prikol
 SC>   ne rabotaet:)
 SC>  -->
 SC> -->
 SC> end txt
 SC> ----
 SC> Как быть в этом случае?
 
 Читать Mastering Regular Expressions. Я уж позволю себе этого наворота тут не
 писать... Если требуется произвольный уровень вложенности, то все еще хуже
 (регексы под это не заточены в принципе), но где-то в недрах perlre либо
 perlfaq был пример.
 
 SC> По теме LWP. Помню, что есть возможность задания таймаута на получение
 SC> документа. Вопрос вот какой - а этот таймаут может при какой-нибудь
 SC> ситуации не сработать. Т.е. этот таймаут сделан на основе мультитрэда или
 SC> же может быть такое, что LWP'шке долго не дают результат, на каком-то шаге
 SC> произошла остановка (ждет ответа от модема например) и как результат -
 SC> завешивание на неопр. вермя?
 
 Судя по тому, что оно проваливается в IO::Socket::INET, таймауты там должны
 быть от select(2), а значит, отвалится. Только судя по коду этого провала, это
 не общий таймаут, а таймаут на каждую операцию с сокетом...
 
 -- 
 Artem Chuprina
 RFC2822: <ran@ran.pp.ru>, FIDO: 2:5020/122.256, ICQ: 13038757
 --- ifmail v.2.15dev5
  * Origin: Leninsky 45 home network (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Логика regexp\'ов и вопрос по LWP   Serg Chervjakov   05 May 2003 22:41:03 
 Re: Логика regexp\'ов и вопрос по LWP   Artem Chuprina   06 May 2003 14:08:14 
 Логика regexp\'ов и вопрос по LWP   Alexander Lunkov   06 May 2003 21:57:14 
 Логика regexp\'ов и вопрос по LWP   Serg Chervjakov   07 May 2003 15:08:26 
 Re: Логика regexp\'ов и вопрос по LWP   Alexey Mahotkin   08 May 2003 09:02:19 
Архивное /ru.perl/114771a32b082.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional