|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Artem Chuprina 2:5020/371.32 05 Jul 2000 13:06:18 To : ochnev@alpha.tula.net Subject : Re: подскажите regexp или что-нибудь, чтобы вырезать атрибуты из тэ -------------------------------------------------------------------------------- тэгов On Wed, 05 Jul 00 08:41:29 +0400 ochnev@alpha.tula.net wrote: oatn> Подскажите, пожалуйста, regexp или что-нибудь, чтобы вырезать атрибуты oatn> из тэгов HTML. Hужно вырезать не сами тэги, а атрибуты из них. oatn> Либо из всех тэгов тотально, либо из нескольких заранее заданных - всех oatn> P, всех TD, например, - то есть жестко прописанных в отдельных командах oatn> программы. oatn> У меня пока не получилось по-нормальному это сделать. Простой, но ненадёжный: s/<([A-Za-z]\w*)\b[^>]+>/<$1>/g; В случае заранее заданных - s/<(P|TD)\b[^>]+>/<$1>/g; Обламывается в ситуациях типа value="Далее >>" Более адекватный регекс отлаживать довольно долго. Если у кого найдётся время, путь развлечётся... -- Счастливо! Ран. --- ifmail v.2.14.os-p7-tma3 * Origin: MemoNet (2:5020/371.32@fidonet) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/347345c34e11.html, оценка из 5, голосов 10
|