|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Vadim Tzirulnicov 2:5020/400 09 Jun 2007 10:01:11 To : Aslan Mirashnichenko Subject : Re: поиск на FTP -------------------------------------------------------------------------------- У меня тоже по данной теме есть вопрос к All. Как лучше сабж осуществить ? Hапример - индексация. Я сбрасываю с БД в хэш все ранее проиндексированные файлы индексируемого хоста, и в процессе его сканирования при получении каждого файла-директории пробегаюсь по хэшу и смотрю, есть ли там этот файл и если да, сходится ли размер. Если нету - делаю INSERT в БД, если размер не сходится - UPDATE. После чего удаляю из хэша файл. После индекации данного фтп я пробегаюсь по всем оставшимся элементам хэша и файлы в них удаляю из БД. При поиске пользователем делается запрос вида select ... from base,host where host.id=base.hostid and match(base_url) against ($search_string). (Hа base_url индекс fulltextsearch) Если пользователь указал параметры поиска - напр. только видео, то добавляется строка and (base_razsh="avi" || base_razsh="mpg" || ...). Вопрос - как лучше оптимизировать алгоритмы индексации и поиска ? Ведь например ftp.chg.ru по данному алгоритму не индексируется - не хватает памяти под хэш. Если ищем "blabla", то выдаст совпадения lala/blabla/123/456.txt lala/blabla/123/4.avi lala/blabla/46.doc и т.д., вместо lala/blabla И хотелось бы, чтобы на первом месте были ближе всего друг к другу расположенные слова запроса, а на последнем - менее всего. Hапример, сначала при запросе "win xp" строка "win xp", затем "wndows xp"и потом уже "windows/notregistered/xp" Хочется и для http поиск сделать... Может, есть готовые решения, которые можно под себя переделать ? Также, вроде как-то видел краем глаза в интернете статью про поисковые алгоритмы, работу поисковика рамблера и т.д., но не могу найти :( "Aslan Mirashnichenko" <gera@glazov.net> сообщил/сообщила в новостях следующее: news:et6dag$10l$1@spin.izhcom.ru... > to All > пожалуйста подскажите, какие модули подойдут для организации поиска > файлов(правила\шаблоны) на FTP-сервере? > > С уважением, Аслан Мирашниченко. --- ifmail v.2.15dev5.3 * Origin: Demos online service (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/65773dc44726.html, оценка из 5, голосов 10
|