|
|
ru.website- RU.WEBSITE ------------------------------------------------------------------- From : Alex Kharitonov 2:5038/7.17 13 Jul 2000 02:14:00 To : Andrej Ramaszeuski Subject : вырезание атрибутов -------------------------------------------------------------------------------- 11 Июл 00 21:45, Andrej Ramaszeuski wrote to Serge Shikov: >>> Вот сейчас возьму и напишу... >>> s|<(\w)+([^>])*>|<$1>|g; SS>> Еще как помешает. Во-первых, значения атрибутов иногда заключают SS>> в кавычки (я бы даже советовал делать это всегда, чтобы иметь в SS>> будущем совместимость с XML). AR> А я бы советовал использовать их только там, где тpебует HTML 4.0, AR> если это HTML 4.0 и там, где тpебут XML, если это XML Если ставить кавычки везде, то меньше вероятность совершить ошибку (если не забывать их закрывать ;-) ). Да и искать в тексте легче (например строка '"http://www.company.com' однозначно из атрибута, если значения атрибутов взяты в двойные кавычки, а в тексте двойные кавычки обозначены через '"'). AR> Хоть десятеpный. Покажи мне стpоку на котоpой этот pегексп не AR> сpаботает. Hа кавычки он, гpубо выpажаясь ложит. Аттpибутом тэга AR> является то, что отделено от его имени пpобелом. А есть там кавычки AR> или скобочки - пофиг. Hа следующем коде твой регексп сработает неправильно: ===Cut=== <SCRIPT type="text/javascript"> <!-- if(a<b) { document.write("!"); } // --> </SCRIPT> ===Cut=== Обрабатываем код s|<(\w+)([^>])*>|<$1>|g; (обрати внимание, что я переставил скобку и плюс, у тебя видимо опечатка). Получаем: ===Cut=== <SCRIPT> <!-- if(a<b> </SCRIPT> ===Cut=== Если в исходном коде не было бы комментариев, то исчез бы закрывающий тег SCRIPT. С уважением, Alex! mailto:askh@go.ru http://home.onego.ru/~alexskh/ PGP key fingerprint: 183A DDC9 D784 4623 98D5 4749 4F9C E20B 47E0 769C --- GoldED/386 3.00.Beta5+ * Origin: ASKh Home (2:5038/7.17) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.website/14741396d38c4.html, оценка из 5, голосов 10
|