|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Stas Vlasov 2:5080/172.172 27 Nov 2005 13:55:16 To : All Subject : Поисковики для локального сайта. --------------------------------------------------------------------------------
Посоветуйте поисковик для локального сайта (конкретнее - localhost на
домашней машине). Сейчас там более 2Гб текста, причем не всегда статического
(из некоторых архивов достается через cgi).
Хотелось бы поисковик, со следующими свойствами:
а) возможность проиндексировать только часть за один запуск (скажем, в
текущем запуске проиндексировать не более N документов, при следующем -
следующие N)
б) не очень большой объем базы (не более 30% от объема текста)
в) работа с русским языком хотя бы для того, чтобы можно было не
различать большие и маленькие буквы
г) чтоб не ЖРАЛ ресурсы во время индексирования
д) возможность подключать свои фильтры для документов (сейчас использую
для выдирания текста из .pdf и перекодировки всего в koi8)
Было испробовано следующее:
1. mnogosearch. ЖРЕТ ресурсы так, что на машине больше ничего нельзя
сделать.
2. glimpse. Всем хорош, но при доиндексации статической части размером в
1.5Гб сломал все свои индексы.
3. swish-e. Индексация по частям - через задницу.
--
Stanislav
--- tin/1.7.8-20050315 ("Scalpay") (UNIX) (Linux/2.6.14-1sarge-686 (i686))
* Origin: The Homestation (2:5080/172.172)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/459652fd19c9.html, оценка из 5, голосов 10
|