Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Kirill Frolov                        2:5030/827.2   06 Jan 2003  23:52:14
 To : All
 Subject : indexing and search tool
 -------------------------------------------------------------------------------- 
 
 
 05 Jan 03 13:57, Kirill Frolov wrote to All:
 
  KF>     Хочу проиндексировать свои файлы (текстовые) для быстрого поиска.
  KF> Мне не нужен Web-поисковик! Попробовал 'mg'. Тоже не работает с
  KF> русскими буквами. Прямо-таки анти-русский заговор какой-то,
 
  KF>     Может можно как-нибудь mnogosearch приспособить?
 
      Hельзя. Контекст не показывает -- это самое плохое.
  Hаходит много, всё лишнее, толку мало. Человеческого интерфейса (как у grep)
 нет.
  Hа ~100Mb входных данных (из них ещё минимум четверть не индексируется) строит 
 60Мб индексов (crc-multi, builtin database). Среднее время поиска 5-10 секунд на
 слово (очень примерно), время напрямую зависит от количества запрашиваемых слов.
 Оказывается в crc-mode не ищет подстроку, видел как оно хранит в single mode -- 
 99Мб (single-mode, builtin database) перелопачивать линейным поиском это, блин, 
 я просто офигеваю, дорогая редакция... по минуте ищет... 100%цпу загрузки...
 Полный поиск grep'ом по всей коллекции файлов (исходные ~100Мб) занимает меньше 
 30-и секунд и единицы процентов загрузки цпу.
 
     Mnogosearch можно переименовывать в dolgosearch и выкинуть нафиг, вопрос
 остаётся актуальным. Смотрел внутрь 'mg', про локаль оно не знает, русские буквы
 за isalpha не считает и поэтому ругается. Интересно, реально-ли это пофиксить,
 или там ещё всяких граблей немеряно может быть? :-/
 --- [ZX]
  * Origin:  Дед Мороз must die!     [ICQ:#148761304] (2:5030/827.2)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 indexing and search tool   Kirill Frolov   05 Jan 2003 14:57:06 
 Re: indexing and search tool   Max A. Krasilnikov   06 Jan 2003 12:23:08 
 Re: indexing and search tool   Sergey Leschenko   06 Jan 2003 14:30:12 
 indexing and search tool   Kirill Frolov   07 Jan 2003 02:33:54 
 indexing and search tool   Kirill Frolov   06 Jan 2003 22:48:56 
 indexing and search tool   Kirill Frolov   06 Jan 2003 23:52:14 
 Re: indexing and search tool   Alexandr S. Agranovsky   07 Jan 2003 12:41:03 
 indexing and search tool   Konstantin Osipov   08 Jan 2003 23:11:24 
 indexing and search tool   Kirill Frolov   10 Jan 2003 03:21:30 
 Re: indexing and search tool   Alexandr S. Agranovsky   10 Jan 2003 07:46:03 
 indexing and search tool   Kirill Frolov   07 Jan 2003 20:40:46 
 indexing and search tool   Ali Albakov   08 Jan 2003 19:40:46 
 indexing and search tool   Kirill Frolov   09 Jan 2003 01:20:00 
 Re: indexing and search tool   Dmitry Astapov   09 Jan 2003 14:14:19 
 Re: indexing and search tool   Kirill Pushkin   11 Jan 2003 01:07:02 
 Re: indexing and search tool   Aleksey Cheusov   08 Jan 2003 19:12:47 
 Re: indexing and search tool   Ilya Anfimov   09 Jan 2003 17:54:17 
 Re: indexing and search tool   Aleksey Cheusov   23 Jan 2003 19:22:20 
 Re: indexing and search tool   Maxime Zakharov   23 Jan 2003 20:19:34 
 indexing and search tool   Kirill Frolov   25 Jan 2003 03:56:12 
 Re: indexing and search tool   Aleksey Cheusov   27 Jan 2003 14:07:07 
Архивное /ru.linux/33313e19f19a.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional