Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Slawa Olhovchenkov                   2:5030/500     27 Jan 2007  03:01:10
 To : Ivan Frolkov
 Subject : HTML parsing
 -------------------------------------------------------------------------------- 
 
 
 27 Jan 07, Ivan Frolkov writes to Slawa Olhovchenkov:
 
  IF>>>>> То есть надо найти "там"? Так это никто не умеет - ни перл, ни
  IF>>>>> человек.
  SO>>>> В самом первом письме я все изложил.
  IF>>> "Hасколько места определенны -- сразу не понятно"
  IF>>> Тут без сверхчеловеческого разума не обойтись :-)
  SO>> А ты после запятой цитату не обрывай и все хорошо будет
 
  IF> Будет как раз очень нехорошо. "Определения признаков мест расположения
  IF> нужного контента" - какой-то прикладной дзен-буддизм. И каковы же эти
  IF> признаки?
 
 Это я как раз хотел бы услышать про каждое средство, что и как там можно
 рассматривать за признаки и как с минимальными руными услиями получить разбор
 конкретной страницы для последующего вычленения признаков. Я подозреваю что для 
 каждого средства признаки будут специфические. Где-то надо анализировать признак
 типа "таблица внутри другой таблицы в пятой ячейке", а для другого -- "тэг
 <table> после пятого тэга <fuck>".
 
  IF> Дерево построить можно. Разобрать по токенам тоже можно. Разобрав,
  IF> построить дерево самому, в конце концов. Автоматом разобрать таблицу.
  IF> Hарисовать шаблон, который генерит страницу такого же рода, и пользоваться
  IF> им не для генерации, а для разбора - пожалуйста. Выдрать кусок хтмля по
  IF> id="" - ради бога. Единственное - с засекреченными признаками проблемы.
 
 Кто такие "засекреченные признаки"?
 
 ... Ходють тут всякие, а потом каталоги пропадают
 --- GoldED+/BSD 1.1.5
  * Origin:  (2:5030/500)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 17:59:34 
 HTML parsing   Ivan Frolkov   26 Jan 2007 18:47:28 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 18:55:00 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 18:13:08 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:19:12 
 HTML parsing   Ivan Frolkov   26 Jan 2007 19:26:57 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:28:42 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 19:34:20 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 20:49:52 
 HTML parsing   Ivan Frolkov   27 Jan 2007 01:21:29 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 01:38:14 
 HTML parsing   Ivan Frolkov   27 Jan 2007 01:43:04 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 02:36:58 
 HTML parsing   Ivan Frolkov   27 Jan 2007 02:45:07 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 02:52:18 
 HTML parsing   Ivan Frolkov   27 Jan 2007 02:58:11 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 03:01:10 
 HTML parsing   Ivan Frolkov   27 Jan 2007 03:10:31 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 03:19:12 
 Re: HTML parsing   Victor Mironov   28 Jan 2007 03:26:04 
 HTML parsing   Slawa Olhovchenkov   28 Jan 2007 03:52:22 
 Re: HTML parsing   Orlovsky Alexander   26 Jan 2007 19:32:19 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:39:58 
 Re: HTML parsing   Orlovsky Alexander   26 Jan 2007 19:48:56 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 19:53:12 
 Re: HTML parsing   Eugene Grosbein   27 Jan 2007 01:15:12 
 HTML parsing   Slawa Olhovchenkov   26 Jan 2007 22:02:30 
 Re: HTML parsing   Andrei Protasovitski   26 Jan 2007 18:10:42 
 Re: HTML parsing   Oleg A. Paraschenko   27 Jan 2007 10:42:02 
 HTML parsing   Slawa Olhovchenkov   27 Jan 2007 12:33:34 
 Re: HTML parsing   Oleg A. Paraschenko   28 Jan 2007 08:56:17 
 HTML parsing   Slawa Olhovchenkov   28 Jan 2007 13:47:04 
 Re: HTML parsing   Oleg A. Paraschenko   29 Jan 2007 05:23:22 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 11:47:02 
 Re: HTML parsing   Artem Chuprina   29 Jan 2007 17:58:33 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 18:05:34 
 Re: HTML parsing   Artem Chuprina   29 Jan 2007 21:03:46 
 HTML parsing   Slawa Olhovchenkov   29 Jan 2007 22:16:54 
 Re: HTML parsing   Artem Chuprina   30 Jan 2007 16:42:57 
Архивное /ru.perl/222145ba89cb.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional