Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Artem Chuprina                       2:5020/371.32  05 Jul 2000  13:06:18
 To : ochnev@alpha.tula.net
 Subject : Re: подскажите regexp   или что-нибудь,   чтобы вырезать атрибуты из тэ
 -------------------------------------------------------------------------------- 
 
 тэгов
 
 On Wed, 05 Jul 00 08:41:29 +0400 ochnev@alpha.tula.net wrote:
 
 oatn> Подскажите, пожалуйста, regexp или что-нибудь, чтобы вырезать атрибуты
 oatn> из тэгов HTML. Hужно вырезать не сами тэги, а атрибуты из них. 
 oatn> Либо из всех тэгов тотально, либо из нескольких заранее заданных - всех
 oatn> P, всех TD, например, - то есть жестко прописанных в отдельных командах
 oatn> программы. 
 
 oatn> У меня пока не получилось по-нормальному это сделать. 
 
 Простой, но ненадёжный:
 
 s/<([A-Za-z]\w*)\b[^>]+>/<$1>/g;
 
 В случае заранее заданных - s/<(P|TD)\b[^>]+>/<$1>/g;
 
 Обламывается в ситуациях типа value="Далее >>"
 
 Более адекватный регекс отлаживать довольно долго. Если у кого найдётся время,
 путь развлечётся...
 
 -- 
 Счастливо!
   Ран.
 --- ifmail v.2.14.os-p7-tma3
  * Origin: MemoNet (2:5020/371.32@fidonet)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: подскажите regexp или что-нибудь, чтобы вырезать атрибуты из тэ   Artem Chuprina   05 Jul 2000 13:06:18 
Архивное /ru.perl/347345c34e11.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional