|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Nikolay Panov 2:5020/400 29 Nov 2005 18:37:17 To : Kirill Frolov Subject : Re: Поисковики для локального сайта. --------------------------------------------------------------------------------
Kirill Frolov wrote:
> NP> В swish-e я пока нашёл ровно два недостатка. Отсутствие инкрементного
> NP> индекса (обещают стабилизировать эту фичу в версии 2.4.4) и отсутствие
> NP> внутренней поддержки utf-8 (дабы можно было индексировать при помощи
> NP> libxml2 и русские доки). Причём второе не должно бы доставлять особых
> NP> неудобств, если поправить вручную parser.c файлик. Полный переход на
> NP> utf-8 обещают к версии 3.0.
> Hе понял. Вот у меня русские тексты. В *.txt.gz, в кодировках от CP866
> до KOI8-R и UTF-8. Вот html в каких попало кодировках. Вот pdf. По большей
> части на русском языке. Я смогу это проиндексировать с помощью swish-e?
> Если он не поддерживает utf-8, но что я буду делать с его latin-1?
> Ведь какой-нибудь koi8-r он точно не умеет.
Это всё он проиндексирует. Как текст. Без проблем.
Проблема в том, что он ведь ещё и как XML умеет индексировать. С поиском
в дальнейшем не только по всему тексту, но и по выбранным тэгам. Вот это
то как раз можно делать либо только в кодировке 8859-1, либо в той,
которую сам пропишешь в parser.c.
--
...Иногда корабль перестает тонуть, как только его покидают крысы...
--- ifmail v.2.15dev5.3
* Origin: Арзамас. Hижегородская. Россия. Земля. Солнечная. Млеч (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/6577c9114880.html, оценка из 5, голосов 10
|