Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Oleg A. Paraschenko                  2:5020/400     27 Jan 2007  10:42:02
 To : Slawa Olhovchenkov
 Subject : Re: HTML parsing
 -------------------------------------------------------------------------------- 
 
 Привет!
 
 On Fri, 26 Jan 2007 16:59:34 +0300
 Slawa Olhovchenkov <Slawa.Olhovchenkov@f500.n5030.z2.fidonet.org> wrote:
 
 ...
 
 > Hасколько места определенны -- сразу не понятно, т.е. средство для
 > разбора должно быть пригодно для исследования структуры страницы на
 > предмет определения признаков мест расположения нужного контента.
 
 В своё время пришли к такой схеме:
 
 * вначале regexp'ами HTML приводится к XML-виду, и
 * на XML натравливается XSLT с функциями расширения.
 
 По поводу пункта два:
 
 http://uucode.com/texts/genxslt/genxslt.html
 
 Писали систему для вытаскивания информации из HTML. Решили писать своё.
 Через год посмотрели друг на друга и сказали: а не изобрели ли мы XSLT.
 -- 
 Oleg Parashchenko  olpa@ http://xmlhack.ru/  XML news in Russian
 http://uucode.com/blog/  Generative Programming, XML, TeX, Scheme
 --- ifmail v.2.15dev5.3
  * Origin: xmlhack.ru (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 17:59:34 
 HTML parsing   Ivan Frolkov   26 Jan 2007 18:47:28 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 18:55:00 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 18:13:08 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:19:12 
 HTML parsing   Ivan Frolkov   26 Jan 2007 19:26:57 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:28:42 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 19:34:20 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 20:49:52 
 HTML parsing   Ivan Frolkov   27 Jan 2007 01:21:29 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 01:38:14 
 HTML parsing   Ivan Frolkov   27 Jan 2007 01:43:04 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 02:36:58 
 HTML parsing   Ivan Frolkov   27 Jan 2007 02:45:07 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 02:52:18 
 HTML parsing   Ivan Frolkov   27 Jan 2007 02:58:11 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 03:01:10 
 HTML parsing   Ivan Frolkov   27 Jan 2007 03:10:31 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 03:19:12 
 Re: HTML parsing   Victor Mironov   28 Jan 2007 03:26:04 
 HTML parsing   Slawa Olhovchenkov   28 Jan 2007 03:52:22 
 Re: HTML parsing   Orlovsky Alexander   26 Jan 2007 19:32:19 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:39:58 
 Re: HTML parsing   Orlovsky Alexander   26 Jan 2007 19:48:56 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:53:12 
 Re: HTML parsing   Eugene Grosbein   27 Jan 2007 01:15:12 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 22:02:30 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 18:10:42 
 Re: HTML parsing   Oleg A. Paraschenko   27 Jan 2007 10:42:02 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 12:33:34 
 Re: HTML parsing   Oleg A. Paraschenko   28 Jan 2007 08:56:17 
 HTML parsing   Slawa Olhovchenkov   28 Jan 2007 13:47:04 
 Re: HTML parsing   Oleg A. Paraschenko   29 Jan 2007 05:23:22 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 11:47:02 
 Re: HTML parsing   Artem Chuprina   29 Jan 2007 17:58:33 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 18:05:34 
 Re: HTML parsing   Artem Chuprina   29 Jan 2007 21:03:46 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 22:16:54 
 Re: HTML parsing   Artem Chuprina   30 Jan 2007 16:42:57 
Архивное /ru.perl/4449bdbe569a.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional