|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Sergej Tarasov 2:5020/175.2 21 Apr 2001 19:01:36 To : vilfred Subject : казалось бы к перлу отношения не имеет, но... -------------------------------------------------------------------------------- Fri Apr 20 2001 20:46, vilfred wrote to All: v> From: vilfred <dmitriy@genphys.phys.msu.su> v> как индекс строить? до смещения я доползу через seek, а индекс то сам как v> делать? v> короче, такая фишка, сделать 33 ячейки, по каждой букве. и позиции слов, v> начинающихся v> с этих букв - результат - поиск будет сразу делать v> выборку из таблицы слов, нащинающихся с данной буквы - но это минимум хеш v> хешей... v> еще большая головная боль, хаха... v> а нужно сделать поиск по 100 мегам текста. v> это вообще на перле разумно сделать? Еще как разумно. Если нужно обязательно без баз данных, то такое я как-то писал. Посмотреть можно здесь http://risearch.webservis.ru Это был мой первый скрипт на Перл, поэтому код грязный, но работает. Там я строю хеш по первым 4 буквам, так что ищет довольно быстро, со 100 мегами проблем не будет. Единственное, память жрет при индексации. Я весь хеш целиком в памяти строю, и только потом на диск сбрасываю. --- ifmail v.2.15 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/3300b8683435.html, оценка из 5, голосов 10
|