Главная страница


ru.cgi.perl

 
 - RU.CGI.PERL ------------------------------------------------------------------
 From : Pavel Ischenco                       2:467/74       14 Nov 2002  04:07:44
 To : ran@ice.ru
 Subject : Re: site search
 -------------------------------------------------------------------------------- 
 
 
 14 Hоя 02 в 03:00, Artem Chuprina писал к Pavel Ischenco:
 
  AC> Hе сдирание, а использование. Или ты учебную работу пишешь?
 
  Поясню ситуацию: есть скромный сайт, у которого основной контент - новости.
  Они ежедневно кидаются в архив. Пофайлово.
  Мне нужно организовать поиск по этим файлам на предмет какого-либо кейворда и
 выдать ссылку на соответствующий файл. Всего-то. Мне не нужна навороченая
 поисковая машина...
  Тут уже кто-то посоветовал оракл поставить. Благо, что нетмэйлом :)
 
  AC> Тогда почитай исходники того же mnogosearch.
 
  Спасибо. Посмотрю.
 
  AC>>> Оно особенно грамотно в ситуации, когда представления о
  AC>>> принципах поиска и прилагательных к ним граблях никакого.
  PI>>  Гм. В какую сторону копать ?
  PI>>  И что не в порядке с моими представлении и принципами поиска ? У
  PI>> меня есть N текстовых файлов, нужно показать ссылки на те, в которых
  PI>>  встречается некое слово. Есть алгоритм, который нужно упростить.
  AC> В боевых условиях работают в две фазы. Сначала индексатор индексирует
  AC> документы, делит на слова и запихивает в реляционную базу с
  AC> информацией о том, в каком документе встречается. Потом при поиске
  AC> поисковик формирует все формы введенного слова и делает запрос к оной
  AC> базе where word in (...).
 
  Довольно сложно, да и надобности в содержании такой базы нет. Кол-во обращений 
 к архиву не большое, не смысла взводить даже мускул... да и коду поболее, имхо
 обработать plain-text намного проще, хотя и не быстрее.
 
  PI>> Если упрощение трех циклов до двух или одного методом некого
  PI>> "шаманства" не возможно - благодарю.
  AC> Писать программы методом шаманства невозможно. Во всяком случае
  AC> работающие.
 
  Хех. Финты ушами не отменяли. Это так, по 7-летнему опыту программирования...
  Вопрос лишь в том, что perl для меня - что-то новое и финтов пока не придумал, 
 а делиться никто не хочет, либо их попросту нет, т.к. язык довольно прост. :-)
 
  P.S. Спасибо за ответы. Остановлюсь пока на работающем уже скрипте с тремя
 циклами и буду "учиться, учиться и учиться" :)
 
 Best regards, Pavel.
                                    [CTPELOK@Ukr.Net] [ICQ UIN 8765062]
 ... Uptime: 5 day(s), 5 hour(s), 46 minute(s), 21 second(s)
 --- <резать тут>
  * Origin: Сайга-12к это калькулятор... для окончательных расчетов. (2:467/74)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 site search   Pavel Ischenco   12 Nov 2002 06:34:12 
 Re: site search   Artem Chuprina   12 Nov 2002 19:20:33 
 Re: site search   Pavel Ischenco   13 Nov 2002 10:35:54 
 Re: site search   Artem Chuprina   14 Nov 2002 04:00:25 
 Re: site search   Pavel Ischenco   14 Nov 2002 04:07:44 
 Re: site search   Serge Pekarsky   15 Nov 2002 15:41:14 
 Re: site search   Artem Chuprina   15 Nov 2002 16:18:41 
 Re: site search   Alex Povolotsky   18 Nov 2002 17:29:58 
 site search   Ruslan Bondarev   15 Nov 2002 00:16:01 
 site search   Sergej Tarasov   15 Nov 2002 04:17:55 
 site search   Ruslan Bondarev   15 Nov 2002 22:02:33 
 Re: site search   Victor Wagner   15 Nov 2002 10:55:21 
 Re: site search   Sergej Tarasov   15 Nov 2002 20:57:23 
 Re: site search   Andrey Savitsky   15 Nov 2002 12:05:12 
 site search   Ruslan Bondarev   15 Nov 2002 21:56:08 
 Re: site search   Artem Chuprina   15 Nov 2002 16:19:43 
 site search   Ruslan Bondarev   15 Nov 2002 22:00:17 
 Re: site search   Victor Wagner   14 Nov 2002 11:36:22 
 Re: site search   Konstantin Tokar   14 Nov 2002 13:03:00 
 Re: site search   Andrey Savitsky   15 Nov 2002 12:01:58 
Архивное /ru.cgi.perl/14733dd2f941.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional