|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Andrey Sapozhnikov 2:5020/400 12 Mar 2002 15:32:01 To : Denis Roshchin Subject : Re: регистр!?! --------------------------------------------------------------------------------
Denis Roshchin wrote:
> Добрый день.
>
> Мне надо разобрать html-файл и вынуть оттудова
> некоторые значения. (в часности то, что между
> <title> и </title> и некоторые meta-тэги).
> проблема в том, что оно может быть как в маленьких так
> и в больших буквах написано (именно системные слова,
> то есть "title", "Title", или "TITLE".)
> я сделал, все работает, но программа завалилась в момент
> когда появилась html-ка где все написанно большими буквами :((
>
> у меня, допустим:
> $content =~ /.*<meta name="creator" content="(.*)">.*/g;$creator = $1;
>
> ps. ну я понимаю, что можно пройти напролом, да при считывании все символы
> поднять (uc, да?) - но мне нужно само значение-то
> с правельным регистром. (то есть можно два раза один и тот-же
> файл открывать, в одном искать, во втором уже по номеру символа но
> муторно... может проще как??)
Прочитать perldoc perlop и perldoc perlre на предмет модификатора i в
регулярных выражениях. Кроме того, модификатор g в данном случае не
нужен. Кроме того, начальная .* и конечная .* тоже не нужны. А
вместо (.*) явно стоит использовать (.*?). Еще стоит проверить
результат выражения, ибо может данного тега в строке и не встретиться.
Hу а на досуге почитать perldoc HTML::Parser. Если этот скрипт не разовая
поделка, то возможно этот модуль Вам пригодится.
Андрей
--- ifmail v.2.15dev5
* Origin: Demos online service (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/528499e4658f.html, оценка из 5, голосов 10
|