|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Artur Penttinen 2:5020/400 05 Jul 2000 13:32:01 To : All Subject : Re: подскажите regexp ил ичто-нибудь, чтобы в ырезать атрибуты из --------------------------------------------------------------------------------
ичто-нибудь, чтобы в
ырезать атрибуты из
тэгов HTML
On 5 Jul 2000, Serge Shikov wrote:
> From: Serge Shikov <shikov@rinet.ru>
> Newsgroups: fido7.ru.perl
> Subject: Re: подскажите regexp иличто-нибудь,
> чтобы вырезать атрибуты из тэгов HTML
> Date: 5 Jul 2000 12:51:43 +0400
> X-Mailer: Mozilla 4.6 [en] (WinNT; I)
> Organization: home
>
> Artur Penttinen wrote:
> >
> > > Подскажите, пожалуйста, regexp или что-нибудь, чтобы вырезать атрибуты
> > > из тэгов HTML. Hужно вырезать не сами тэги, а атрибуты из них.
> > > Либо из всех тэгов тотально, либо из нескольких заранее заданных - всех
> > > P, всех TD, например, - то есть жестко прописанных в отдельных командах
> > > программы.
> > >
> > > У меня пока не получилось по-нормальному это сделать.
> >
> > $/ = undef; $_ = <STDIN>;
> > s/<(\w+) [^>]+>/<\1>/g;
> Просили же по-нормальному... Ты в курсе, что в значениях атрибутов
> допускается >?
>
> Hапример <option value=">нафиг, нафиг такие программы>"> - и куда пойдет
> твой регексп на такой допустимой конструкции?
Знаю. Ради интереса проверил как-то - а есть-ли такие html'ы
В ближайшей окрестности не нашел.
ok:
s/<(\w+) (?:\w+=(.).*?(?<=\\)\2|\w+=\w+|\w+)\b/<$1/g
Примерно так - не отлаживал
Ваше слово, Товарищ Маузер :)
WBW, Artur
--
С кем поведешься - так тебе и надо
--- ifmail v.2.15dev5
* Origin: Gamma NNTP server Moscow Russia (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/117263cbd0f65.html, оценка из 5, голосов 10
|