|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Anton Martynov 2:5080/1003 23 Jul 2003 11:28:58 To : Anatolii Leanca Subject : Re: HTML -------------------------------------------------------------------------------- "Anatolii Leanca" <Anatolii.Leanca@p63.f125.n469.z2.fidonet.org> wrote in message news:1058862158@p63.f125.n469.z2.ftn... > К сожалению, при детальном просмотре именованные теги не обнаружились. Вообще > меня не покидает идея ориентироваться по таблицам. Так как сам занимаюсь > разбивкой ХТМЛ использую таблицы для формирования дизайна. Поэтому есть > предположение назвать каждую таблицу своим именем (tbl1,tbl2,...) аналогично > можно называть и теги <tr><td> (tbl1tr1, tbl1tr1td1). Hо при выборе этого > варианта идет дикий парсинг строк, и соответсвенно жутчайший алгоритм выборки > необходимых элементов. > Как расширенный как расширенный вариант видется дерево, элементы которого > аналогичным образом проименонованы. Hо для построения его прийдется > использовать рекурсию... > > Если разворачивать всю цепочку поиска с конца, то получается такой алгоритм: > > Hайденная строка->окружающие ее теги(<b><i><font>)->тег "<td>" -> тег <tr> -> > тег <table> > > вот пример с уже "проименованными" тегами [cutz] > > Что скажете по этому поводу? слушай, а чего ты так заморачиваешься? ты парсинг документа где хочешь делать? если на клиентском компе, на котором стоит windows с internet explorer'ом - можно использовать mshtml.dll. если на стороне сервера, где стоит, например unix и apache - уже существуют библиотеки для парсинга html для php, python, perl... свой парсер писать - дело нудное и долгое.... -- enjoy with a poison... injected with a poison ... d909 (ua) --- ifmail v.2.15dev5 * Origin: (http://news.cca.usart.ru/) USURT's FidoNET<-> (2:5080/1003@fidonet) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/1464681ce8bf8.html, оценка из 5, голосов 10
|