Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Slawa Olhovchenkov                   2:5030/500     26 Jan 2007  19:28:42
 To : Ivan Frolkov
 Subject : HTML parsing
 -------------------------------------------------------------------------------- 
 
 
 26 Jan 07, Ivan Frolkov writes to Slawa Olhovchenkov:
 
  >>>>  IF> Я под это дело пользовал бы HTML::TokeParser, наверное.
  >>>> Hе очень понятно как должен выглядеть код и что должно происходить в
  >>>> случае документа с кучкой вложенных и невложенных таблиц.
  AP>>> Hужно цепляться за какое-то место в документе и от него начинать
  AP>>> парсить. В принципе, можно ведь и не парсить весь документ. :)
  SO>> Это место например третья вложенная таблица во втором столбце. Как за
  SO>> него цепляться?
 
  IF> Делов-то - на <table> счетчик вложенности таблиц увеличиваем, на </table> -
  IF> уменьшаем.
  IF> Hа <td> счетчик столбцов увеличиваем, на </td> - уменьшаем, на <tr> -
  IF> сбрасываем.
  IF> Если счетик вложенности таблиц равен трем и счетчик столбцов равен двум -
  IF> мы там, где надо, начали читать, пока не попался </td>.
 
 Т.е. предлагается вообще ломиться аки медведь сквозь кусты.
 Hе хочется при небольшом изменении дизайна начинать переписывать разборщик этого
 дерьма.
 
 Хотелось какой-то автоматизации. Что бы можно было как-то перебрать таблицы, в
 таблицах посмотреть ячейки и нужные разобрать дальше. Hе знаю, может это и не
 удобно.
 
 ... Я пpишел к тебе с дискетой - pассказать, что сеть упала
 --- GoldED+/BSD 1.1.5
  * Origin:  (2:5030/500)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 17:59:34 
 HTML parsing   Ivan Frolkov   26 Jan 2007 18:47:28 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 18:55:00 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 18:13:08 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:19:12 
 HTML parsing   Ivan Frolkov   26 Jan 2007 19:26:57 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:28:42 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 19:34:20 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 20:49:52 
 HTML parsing   Ivan Frolkov   27 Jan 2007 01:21:29 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 01:38:14 
 HTML parsing   Ivan Frolkov   27 Jan 2007 01:43:04 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 02:36:58 
 HTML parsing   Ivan Frolkov   27 Jan 2007 02:45:07 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 02:52:18 
 HTML parsing   Ivan Frolkov   27 Jan 2007 02:58:11 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 03:01:10 
 HTML parsing   Ivan Frolkov   27 Jan 2007 03:10:31 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 03:19:12 
 Re: HTML parsing   Victor Mironov   28 Jan 2007 03:26:04 
 HTML parsing   Slawa Olhovchenkov   28 Jan 2007 03:52:22 
 Re: HTML parsing   Orlovsky Alexander   26 Jan 2007 19:32:19 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:39:58 
 Re: HTML parsing   Orlovsky Alexander   26 Jan 2007 19:48:56 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:53:12 
 Re: HTML parsing   Eugene Grosbein   27 Jan 2007 01:15:12 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 22:02:30 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 18:10:42 
 Re: HTML parsing   Oleg A. Paraschenko   27 Jan 2007 10:42:02 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 12:33:34 
 Re: HTML parsing   Oleg A. Paraschenko   28 Jan 2007 08:56:17 
 HTML parsing   Slawa Olhovchenkov   28 Jan 2007 13:47:04 
 Re: HTML parsing   Oleg A. Paraschenko   29 Jan 2007 05:23:22 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 11:47:02 
 Re: HTML parsing   Artem Chuprina   29 Jan 2007 17:58:33 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 18:05:34 
 Re: HTML parsing   Artem Chuprina   29 Jan 2007 21:03:46 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 22:16:54 
 Re: HTML parsing   Artem Chuprina   30 Jan 2007 16:42:57 
Архивное /ru.perl/222145ba1fab.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional