|
|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Justin Finch-Fletchley 2:5020/400 01 Aug 2004 13:28:00 To : Paul Petruk Subject : деревья ? -------------------------------------------------------------------------------- Sun Aug 01 2004 03:38, Paul Petruk wrote to Serge Chervjakov: SC>> Создай базу данных, таблицу строк. Каждую строку разбей на слова. SC>> Добавь слова в другую таблицу, по одной записи на слово. SC>> Проиндексируй PP> C базами данных возится не yмею, поэтомy пока преобразовал мой файл так: Hу и очень плохо что не умеешь, ибо это щаз достаточно стандартный подход и когда можно и целесообразно, его надо использовать... ибо потом, кто-то будет плеваться, что какой-то программер сделал какую-то свою, в левом формате базу данных, не приделал к ней никакого нормального интерфейса (а-ля нормальный класс работы с ней, а не дешифровка в самом скрипте), все запутал, а мне теперь распутывать:). Я уже попадал на такие скрипты, все заканчивалось банальным переписыванием на БД и выяснением, что оказывается возможностей к извратам (ну кто знает, какие извраты иногда оптимизаторам страниц требуются, тот поймет:) ) у моего скрипта куда больше:). PP> Т.е. при считывании если обнарyживается /^#/, то обновляется переменная PP> $path, которая добавляется в начало каждой строки и потом yже что-то PP> ищется. PP> Хоть размер yменьшился в 3 раза, но обрабатывать это перлом HАМHОГО PP> медленнее, чем создать цепочкy из grep'ов. Быстрей всего, либо самому создать индекс, т.е. запомнить где какие слова есть и отсортировать все это дело, либо воспользоваться базой данных, что б она создала такой индекс и искать уже по индексированым полям. Смотри ПХПББ на тему алгоритма осуществления этого дела, ибо сомневаюсь, что поиске в базе с порядка 600000 сообщений (хотя бы тот же earnforum.com) используется обычный поиск типа использования like или еще чего-нибудь в этом роде... --- ifmail v.2.15dev5.3 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/16679f44dc8ab.html, оценка из 5, голосов 10
|