|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Ivan Frolkov 2:5020/175.2 26 Jan 2007 19:26:57 To : Slawa Olhovchenkov Subject : HTML parsing -------------------------------------------------------------------------------- Fri Jan 26 2007 18:19, Slawa Olhovchenkov wrote to Andrei Protasovitski: >>> IF> Я под это дело пользовал бы HTML::TokeParser, наверное. >>> Hе очень понятно как должен выглядеть код и что должно происходить в >>> случае документа с кучкой вложенных и невложенных таблиц. AP>> Hужно цепляться за какое-то место в документе и от него начинать AP>> парсить. В принципе, можно ведь и не парсить весь документ. :) SO> Это место например третья вложенная таблица во втором столбце. Как за SO> него цепляться? Делов-то - на <table> счетчик вложенности таблиц увеличиваем, на </table> - уменьшаем. Hа <td> счетчик столбцов увеличиваем, на </td> - уменьшаем, на <tr> - сбрасываем. Если счетик вложенности таблиц равен трем и счетчик столбцов равен двум - мы там, где надо, начали читать, пока не попался </td>. --- ifmail v.2.15dev5 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/33006e87704e.html, оценка из 5, голосов 10
|