|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Anatolii Leanca 2:469/125.63 22 Jul 2003 10:42:27 To : Khvorov Vasiliy Subject : HTML -------------------------------------------------------------------------------- Однажды, a точнее во вторник 22 июля 2003, Khvorov Vasiliy сообщил(a): AL>> ХТМЛ странички аукционов на которых находится описание лота. В AL>> основном, их структура почти идентична. KV> ====X==== кусано ====X==== AL>> Как определить положение необходимого тега/элемента в ХТМЛ коде? Может AL>> стоит пронумеровать теги каким-то образом. KV> Как я понял, ХТМЛ сгенерированный... Вижу следующие подходы: KV> - Изучить теги на наличие аттрибутов (name, id) KV> - Воспроизвести алгоритм генератора - это поможет установить структуру KV> страниц (контейнеры, элементы данных) К сожалению, при детальном просмотре именованные теги не обнаружились. Вообще меня не покидает идея ориентироваться по таблицам. Так как сам занимаюсь разбивкой ХТМЛ использую таблицы для формирования дизайна. Поэтому есть предположение назвать каждую таблицу своим именем (tbl1,tbl2,...) аналогично можно называть и теги <tr><td> (tbl1tr1, tbl1tr1td1). Hо при выборе этого варианта идет дикий парсинг строк, и соответсвенно жутчайший алгоритм выборки необходимых элементов. Как расширенный как расширенный вариант видется дерево, элементы которого аналогичным образом проименонованы. Hо для построения его прийдется использовать рекурсию... Если разворачивать всю цепочку поиска с конца, то получается такой алгоритм: Hайденная строка->окружающие ее теги(<b><i><font>)->тег "<td>" -> тег <tr> -> тег <table> вот пример с уже "проименованными" тегами <TABLE name=tbl2> <TR name=tbl2tr1> <TD vAlign=center colSpan=6 name=tbl2tr1td1> <IMG title="" height=6 src="http://pics.ebay.com/aw/pics/x.gif" width=1> </TD> </TR> <TR name=tbl2tr2> <TD vAlign=center bgColor=#9999cc colSpan=6 name=tbl2tr2td1> <IMG title="" height=2 src="http://pics.ebay.com/aw/pics/x.gif" width=1> </TD> </TR> <TR bgColor=#d6dcfe name=tbl2tr3> <TD name=tbl2tr3td1> <IMG title="" height=1 alt=" " src="http://pics.ebay.com/aw/pics/x.gif" width=6> </TD> <TD width="100%" name=tbl2tr3td2> <FONT face=Arial size=4> <B> 1961 Volkswagen : Beetle (Pre-1998) </B> </FONT> </TD> <TD noWrap align=right name=tbl2tr3td3> <FONT face=Arial size=2> Item number: 2422085204 </FONT> </TD> <TD align=right name=tbl2tr3td4> <IMG title="" height=1 alt=" " src="http://pics.ebay.com/aw/pics/x.gif" width=12> </TD> </TR> и с развертка с конца будет выглядеть так: 1. 1961 Volkswagen : Beetle (Pre-1998) 2. <FONT face=Arial size=4> <B> 1961 Volkswagen : Beetle (Pre-1998) </B> </FONT> 3. tbl2tr3td2 4. tbl2tr3 5. tbl2 И если по примеру строить шаблон получается такая штука: tbl2 -> tbl2tr3 -> tbl2tr3td2 -> -> <FONT face=Arial size=4><B> %some_string% </B></FONT> Что скажете по этому поводу? Bye. ДДДДДД _WBR_ _/Anatolii/_ ДДДДДДДДДДДДДДДДДДДДДДДДДДД[Team TELECOM MUST DIE]ДДД --- Если делать все с любовью, ничего страшного не получится. * Origin: Quod licet Iovi non licet bovi. (2:469/125.63) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/33703f1cf44e.html, оценка из 5, голосов 10
|