|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Slawa Olhovchenkov 2:5030/500 26 Jan 2007 19:28:42 To : Ivan Frolkov Subject : HTML parsing -------------------------------------------------------------------------------- 26 Jan 07, Ivan Frolkov writes to Slawa Olhovchenkov: >>>> IF> Я под это дело пользовал бы HTML::TokeParser, наверное. >>>> Hе очень понятно как должен выглядеть код и что должно происходить в >>>> случае документа с кучкой вложенных и невложенных таблиц. AP>>> Hужно цепляться за какое-то место в документе и от него начинать AP>>> парсить. В принципе, можно ведь и не парсить весь документ. :) SO>> Это место например третья вложенная таблица во втором столбце. Как за SO>> него цепляться? IF> Делов-то - на <table> счетчик вложенности таблиц увеличиваем, на </table> - IF> уменьшаем. IF> Hа <td> счетчик столбцов увеличиваем, на </td> - уменьшаем, на <tr> - IF> сбрасываем. IF> Если счетик вложенности таблиц равен трем и счетчик столбцов равен двум - IF> мы там, где надо, начали читать, пока не попался </td>. Т.е. предлагается вообще ломиться аки медведь сквозь кусты. Hе хочется при небольшом изменении дизайна начинать переписывать разборщик этого дерьма. Хотелось какой-то автоматизации. Что бы можно было как-то перебрать таблицы, в таблицах посмотреть ячейки и нужные разобрать дальше. Hе знаю, может это и не удобно. ... Я пpишел к тебе с дискетой - pассказать, что сеть упала --- GoldED+/BSD 1.1.5 * Origin: (2:5030/500) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/222145ba1fab.html, оценка из 5, голосов 10
|