Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Vadim Tzirulnicov                    2:5020/400     09 Jun 2007  10:01:11
 To : Aslan Mirashnichenko
 Subject : Re: поиск на FTP
 -------------------------------------------------------------------------------- 
 
 У меня тоже по данной теме есть вопрос к All. Как лучше сабж осуществить ?
 
 Hапример - индексация. Я сбрасываю с БД в хэш все ранее проиндексированные
 файлы индексируемого хоста, и в процессе его сканирования при получении
 каждого файла-директории пробегаюсь по хэшу и смотрю, есть ли там этот файл
 и если да, сходится ли размер. Если нету - делаю INSERT в БД, если размер не
 сходится - UPDATE. После чего удаляю из хэша файл. После индекации данного
 фтп я пробегаюсь по всем оставшимся элементам хэша и файлы в них удаляю из
 БД.
 
 При поиске пользователем делается запрос вида select ... from base,host
 where host.id=base.hostid and match(base_url) against ($search_string). (Hа
 base_url индекс fulltextsearch)
 Если пользователь указал параметры поиска - напр. только видео, то
 добавляется строка and (base_razsh="avi" || base_razsh="mpg" || ...).
 
 Вопрос - как лучше оптимизировать алгоритмы индексации и поиска ? Ведь
 например ftp.chg.ru по данному алгоритму не индексируется - не хватает
 памяти под хэш. Если ищем "blabla", то выдаст совпадения
 lala/blabla/123/456.txt
 lala/blabla/123/4.avi
 lala/blabla/46.doc
 и т.д., вместо lala/blabla
 И хотелось бы, чтобы на первом месте были ближе всего друг к другу
 расположенные слова запроса, а на последнем - менее всего.
 Hапример, сначала при запросе "win xp" строка "win xp", затем "wndows xp"и
 потом уже "windows/notregistered/xp"
 
 Хочется и для http поиск сделать... Может, есть готовые решения, которые
 можно под себя переделать ?
 
 Также, вроде как-то видел краем глаза в интернете статью про поисковые
 алгоритмы, работу поисковика рамблера и т.д., но не могу найти :(
 
 "Aslan Mirashnichenko" <gera@glazov.net> сообщил/сообщила в новостях
 следующее: news:et6dag$10l$1@spin.izhcom.ru...
 
 > to All
 > пожалуйста подскажите, какие модули подойдут для организации поиска
 > файлов(правила\шаблоны) на FTP-сервере?
 >
 > С уважением, Аслан Мирашниченко.
 --- ifmail v.2.15dev5.3
  * Origin: Demos online service (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 поиск на FTP   Aslan Mirashnichenko   13 Mar 2007 19:18:28 
 Re: поиск на FTP   Vadim Tzirulnicov   09 Jun 2007 10:01:11 
Архивное /ru.perl/65773dc44726.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional