Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Stas Vlasov                          2:5080/172.172 12 Nov 2002  20:13:21
 To : Artem Chuprina
 Subject : Re: поиск русских слов
 -------------------------------------------------------------------------------- 
 
 
 Tuesday November 05 2002, Artem Chuprina writes to Stas Vlasov:
 
 Прошу прощения за тормоза в ответе. Праздники у хабов и провайдеров.
 
  SV>> Как сделать поиск вообще - представляю. catdoc, pdf2text (или что
  SV>> там есть еще?), w3m -dump, что-нибудь еще подобное, затем 2k от
  SV>> Балдина, затем - обычный поиск слова. Хочу, чтобы это слово можно
  SV>> было искать не только в той форме, в какой задал. Подскажите путь.
 
  AC> mnogosearch или ispell, в зависимости от того, как именно хочется
  AC> сделать поиск. Многосерч рассчитан на сервер - индексирует, хранит в
  AC> базе, при поиске нормализует заданное слово и выдает id документов.
  AC> ispell можно прикрутить для схемы, рассчитанной на отсутствие
  AC> постоянно поддерживаемой базы - просишь его выдать все формы слова и
  AC> ищешь любую из них.
 
 Спасибо за подсказку. Думаю, что через прямой поиск будет проще, ибо БД надо и
 обновлять иногда, чего дома не всегда получается.
 
 Только еще вопрос:
 Как _эффективно_ узнать, есть ли слово из набора в строке?
 И в чем удобнее хранить набор?
 
 Впрочем, еще есть вариант - выделить все слова из строки и поочередно смотреть
 их в хеше.
 
 Good luck.
          Stas
 
 --- Еще одно "золото" 1.1.5-20020105
  * Origin: gui is good, but console better (2:5080/172.172)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 поиск русских слов   Stas Vlasov   04 Nov 2002 20:40:30 
 Re: поиск русских слов   Artem Chuprina   05 Nov 2002 15:27:52 
 Re: поиск русских слов   Stas Vlasov   12 Nov 2002 20:13:21 
 Re: поиск русских слов   Artem Chuprina   13 Nov 2002 17:33:30 
Архивное /ru.perl/45963dd10c9f.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional