|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Ivan Frolkov 2:5020/175.2 27 Jan 2007 02:58:11 To : Slawa Olhovchenkov Subject : HTML parsing --------------------------------------------------------------------------------
Sat Jan 27 2007 01:52, Slawa Olhovchenkov wrote to Ivan Frolkov:
IF>>>> То есть надо найти "там"? Так это никто не умеет - ни перл, ни
IF>>>> человек.
SO>>> В самом первом письме я все изложил.
IF>> "Hасколько места определенны -- сразу не понятно"
IF>> Тут без сверхчеловеческого разума не обойтись :-)
SO> А ты после запятой цитату не обрывай и все хорошо будет
Будет как раз очень нехорошо. "Определения признаков мест расположения нужного
контента" - какой-то прикладной дзен-буддизм. И каковы же эти признаки?
Дерево построить можно. Разобрать по токенам тоже можно. Разобрав, построить
дерево самому, в конце концов. Автоматом разобрать таблицу. Hарисовать шаблон,
который генерит страницу такого же рода, и пользоваться им не для генерации, а
для разбора - пожалуйста. Выдрать кусок хтмля по id="" - ради бога.
Единственное - с засекреченными признаками проблемы.
--- ifmail v.2.15dev5
* Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/33006ea1e0d6.html, оценка из 5, голосов 10
|