|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Kirill Frolov 2:5030/827.2 05 Feb 2005 23:04:09 To : Zahar Kiselev Subject : Re: Поиск одинаковых файлов --------------------------------------------------------------------------------
On Fri, 04 Feb 05 22:40:06 +0300, Zahar Kiselev wrote:
ZK> Понятно, что создание достаточно полноценного индекса потребует огромной
ZK> вычислительной работы - надо фактически вычислить "коэффициент похожести"
ZK> друг на друга для всех нескольких десятков тысяч файлов, плюс запомнить в
ZK> индексе все основные признаки для каждого. Hо процессору домашнего
ZK> компьютера все равно 95% времени нечем заняться - вот пусть и поработает.
ZK> Интересно - по каким ключевым словам можно поискать готовые наработки в
ZK> данной области? Пусть хотябы для начала только для текстовых документов...
ZK> У меня например только сохраненных писем из фидо - многие тысячи...
Hасчёт похожести не знаю, но для поиска информации в свалке файлов
справляется glimpse. По моему опыту, лучше чем mnogosearch.
--- [ZX]
* Origin: [ лучше пингвин в руках, чем журавль в облаках ] (2:5030/827.2)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/5962666a7bc6.html, оценка из 5, голосов 10
|