Главная страница


ru.linux

 
 - RU.LINUX ---------------------------------------------------------------------
 From : Nikolay Panov                        2:5020/400     29 Nov 2005  15:52:59
 To : Stas Vlasov
 Subject : Re: Поисковики для  локального  сайта.
 -------------------------------------------------------------------------------- 
 
 Stas Vlasov wrote:
 
 >  NP> Лучше swish-e ничего как бы и нет.
 > Hа мой взгляд, glimpse получше будет, но у него свои особенности.
 
 Любопытно -- чем именно лучше?
 В swish-e я пока нашёл ровно два недостатка. Отсутствие инкрементного
 индекса (обещают стабилизировать эту фичу в версии 2.4.4) и отсутствие
 внутренней поддержки utf-8 (дабы можно было индексировать при помощи
 libxml2 и русские доки). Причём второе не должно бы доставлять особых
 неудобств, если поправить вручную parser.c файлик. Полный переход на
 utf-8 обещают к версии 3.0.
 
 > Именно полтора гига разных файлов.
 > Доиндексировал раз в 15-й. Машинка домашняя, так что максимум пару часов
 > в день на это дело.
 
 Когда индексировал lib.ru и её подобных по объёму -- оставлял комп
 работать на время, когда ухожу на работу я. То есть, часов с 10 оно
 спокойно переваривало себе djvu/pdf/ps/txt/txt.zip/txt.rar и прочие файлы.
 Обычно этого срока хватало. Если нет -- разбивал зоны индексирования на
 более мелкие участки.
 
 >  NP> Ага. В следующей версии обещают полностью рабочий incremental indexing
 >  NP> (малорабочий есть и сейчас).
 > Hе доживу. Скорее, сменю квартиру и сделаю отдельный сервер для всего
 > этого... Лет через 5...
 
 Hу, прошлая версия там довольно давно появилась. Если шансы, что пора
 проявится чему-либо новому. По крайней мере их рассылка вполне себе живая.
 
 >  NP> Пока я обхожусь разделением зон индексации. То есть, индексирую не всё
 >  NP> скопом, а по каталогам, например. Благо клиент умеет брать инфу сразу от
 >  NP> кучи индексов.
 > Как ему объяснить, что ссылки на предыдущий каталог не обрабатывать?
 > Иначе бы так и сделал, но эти полтора гига swish-e будет обрабатывать
 > этак часов 10, ибо там все связано.
 
 Что значит "ссылки"? Символические ссылки файловой системы? Тогда
 достаточно сказать "FollowSymLinks NO".
 
 -- 
 ...Ещё в школе, когда в тетради перестали вкладывать промокашки, я
 понял, что страна разваливается...
 
 --- ifmail v.2.15dev5.3
  * Origin: Арзамас. Hижегородская. Россия. Земля. Солнечная.  Млеч (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: Поисковики для локального сайта.   Nikolay Panov   29 Nov 2005 15:52:59 
 Re: Поисковики для локального сайта.   Kirill Frolov   29 Nov 2005 17:28:17 
 Re: Поисковики для локального сайта.   Nikolay Panov   29 Nov 2005 18:37:17 
 Re: Поисковики для локального сайта.   Stas Vlasov   30 Nov 2005 11:42:13 
Архивное /ru.linux/657713f28d7b.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional