|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Nikolay Panov 2:5020/400 29 Nov 2005 15:52:59 To : Stas Vlasov Subject : Re: Поисковики для локального сайта. -------------------------------------------------------------------------------- Stas Vlasov wrote: > NP> Лучше swish-e ничего как бы и нет. > Hа мой взгляд, glimpse получше будет, но у него свои особенности. Любопытно -- чем именно лучше? В swish-e я пока нашёл ровно два недостатка. Отсутствие инкрементного индекса (обещают стабилизировать эту фичу в версии 2.4.4) и отсутствие внутренней поддержки utf-8 (дабы можно было индексировать при помощи libxml2 и русские доки). Причём второе не должно бы доставлять особых неудобств, если поправить вручную parser.c файлик. Полный переход на utf-8 обещают к версии 3.0. > Именно полтора гига разных файлов. > Доиндексировал раз в 15-й. Машинка домашняя, так что максимум пару часов > в день на это дело. Когда индексировал lib.ru и её подобных по объёму -- оставлял комп работать на время, когда ухожу на работу я. То есть, часов с 10 оно спокойно переваривало себе djvu/pdf/ps/txt/txt.zip/txt.rar и прочие файлы. Обычно этого срока хватало. Если нет -- разбивал зоны индексирования на более мелкие участки. > NP> Ага. В следующей версии обещают полностью рабочий incremental indexing > NP> (малорабочий есть и сейчас). > Hе доживу. Скорее, сменю квартиру и сделаю отдельный сервер для всего > этого... Лет через 5... Hу, прошлая версия там довольно давно появилась. Если шансы, что пора проявится чему-либо новому. По крайней мере их рассылка вполне себе живая. > NP> Пока я обхожусь разделением зон индексации. То есть, индексирую не всё > NP> скопом, а по каталогам, например. Благо клиент умеет брать инфу сразу от > NP> кучи индексов. > Как ему объяснить, что ссылки на предыдущий каталог не обрабатывать? > Иначе бы так и сделал, но эти полтора гига swish-e будет обрабатывать > этак часов 10, ибо там все связано. Что значит "ссылки"? Символические ссылки файловой системы? Тогда достаточно сказать "FollowSymLinks NO". -- ...Ещё в школе, когда в тетради перестали вкладывать промокашки, я понял, что страна разваливается... --- ifmail v.2.15dev5.3 * Origin: Арзамас. Hижегородская. Россия. Земля. Солнечная. Млеч (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/657713f28d7b.html, оценка из 5, голосов 10
|