Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Andrei Protasovitski                 2:450/186      26 Jan 2007  19:37:53
 To : 
 Subject : Re: HTML parsing
 -------------------------------------------------------------------------------- 
 
 Доброго здоровья!
 
 Orlovsky Alexander пишет:
 
 >  AP>> Hужно цепляться за какое-то место в документе и от него начинать
 >  AP>> парсить. В принципе, можно ведь и не парсить весь документ. :)
 > 
 >  SO> Это место например третья вложенная таблица во втором столбце. Как за
 >  SO> него цепляться?
 > 
 > Берешь, SAX парзер.... :) И используя свои счетчики подсчитываешь, в каком 
 > по счету столбце и таблице парзер находится.
 
 SAX-парсер нельзя, потому что HTML не есть well-formed XML. Поэтому 
 только HTML::TokeParser.
 
 -- 
 Andrei Protasovitski
 mailto: andrei.protasovitski()gmail.com
     ICQ: 75725244
     AIM: protasovitski
     MSN: protasonic@hotmail.com
 Jabber: AS_Pushkin@mova.org
 --- Mozilla/5.0 (X11; U; Linux i686; ru-RU; rv:1.8.1.2pre) Gecko/20070111
 SeaMonkey/1.1
  * Origin: -= http://fido.ext.by (sponsored by http://extmedia.com) (2:450/186)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 19:37:53 
Архивное /ru.perl/2760198e47c4.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional