|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Andrei Protasovitski 2:450/186 26 Jan 2007 19:37:53 To : Subject : Re: HTML parsing --------------------------------------------------------------------------------
Доброго здоровья!
Orlovsky Alexander пишет:
> AP>> Hужно цепляться за какое-то место в документе и от него начинать
> AP>> парсить. В принципе, можно ведь и не парсить весь документ. :)
>
> SO> Это место например третья вложенная таблица во втором столбце. Как за
> SO> него цепляться?
>
> Берешь, SAX парзер.... :) И используя свои счетчики подсчитываешь, в каком
> по счету столбце и таблице парзер находится.
SAX-парсер нельзя, потому что HTML не есть well-formed XML. Поэтому
только HTML::TokeParser.
--
Andrei Protasovitski
mailto: andrei.protasovitski()gmail.com
ICQ: 75725244
AIM: protasovitski
MSN: protasonic@hotmail.com
Jabber: AS_Pushkin@mova.org
--- Mozilla/5.0 (X11; U; Linux i686; ru-RU; rv:1.8.1.2pre) Gecko/20070111
SeaMonkey/1.1
* Origin: -= http://fido.ext.by (sponsored by http://extmedia.com) (2:450/186)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/2760198e47c4.html, оценка из 5, голосов 10
|