|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Ivan Frolkov 2:5020/175.2 27 Jan 2007 03:10:31 To : Slawa Olhovchenkov Subject : HTML parsing --------------------------------------------------------------------------------
Sat Jan 27 2007 02:01, Slawa Olhovchenkov wrote to Ivan Frolkov:
IF>> Будет как раз очень нехорошо. "Определения признаков мест расположения
IF>> нужного контента" - какой-то прикладной дзен-буддизм. И каковы же эти
IF>> признаки?
SO> Это я как раз хотел бы услышать про каждое средство, что и как там можно
SO> рассматривать за признаки и как с минимальными руными услиями получить
SO> разбор конкретной страницы для последующего вычленения признаков. Я
SO> подозреваю что для каждого средства признаки будут специфические. Где-то
SO> надо анализировать признак типа "таблица внутри другой таблицы в пятой
SO> ячейке", а для другого -- "тэг <table> после пятого тэга <fuck>".
Hу тогда только ручками через TreeParser или TokeParser. Если не секрет -
откуда такая странная задача?
--- ifmail v.2.15dev5
* Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/33006ea299d9.html, оценка из 5, голосов 10
|