|
|
ru.internet.business- RU.INTERNET.BUSINESS --------------------------------------------------------- From : Andrej 2:5020/400 25 Dec 2000 17:19:54 To : All Subject : Spider !!! с шикарными возможностями -------------------------------------------------------------------------------- Люди, помогите! Около года назад попался мне скрипт - паучок с шикарными возможностями, на перл Он позволял не только в слепую лазить и индексировать сайты, но и настраиваться на определенные слова или сочетания слов, и индексировать только сайты имеющие эти сочетания. Плюс там были антиспамерские штучки типа, если "TITLE" одинаковое, то он мог или предупредить об этом или не индексировать Далее, паук сохранял в базу URL, метатеги. По умалчиванию TITLE, DESCRIPTION и KEYWORDS, но с возможностью настроить любые другие вплоть до указанного количества символов HTML документа. И что самое главное, Блин!!! он умел анализировать свою базу и присваивать каждому проиндексированному сайту категорию в готовой базе данных! Hапример, если в метатагах встречаются чаще всего следующие ключевые слова: climbing, Expeditions, Expeditions, Hiking, Himalaya, horse ride tour, Hunters, hunting hunting Он бы присвоил этому сайту категорию "Туризм" Опять же, это все можно было настроить по своему усмотрению Так же, он мог сохранять базу в кучу известных форматов баз данных плюс можно было настроить в свой собственный формат Тогда я не обратил особого внимания за ненадобностью, поигрался и успокоился. Сейчас уже неделю роюсь в интенете, ничего подобного найти не могу Проблема в том, что это была бета версия, не особенно прорекламированная. Hаткнулся тогда я на нее случайно. Естественно сохранил я ее на винте, но около месяца назад грохнулся винт и естно все потерялось. Даже названия не помню... Помогите, если хоть кто ни будь встречался с подобной вещью! -- Hу, Пока! Андрей --- ifmail v.2.15dev5 * Origin: ISP ElCat (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.internet.business/857851def41d.html, оценка из 5, голосов 10
|