|
ru.cgi.perl- RU.CGI.PERL ------------------------------------------------------------------ From : Victor Wagner 2:5020/400 14 Nov 2002 11:36:22 To : Pavel Ischenco Subject : Re: site search -------------------------------------------------------------------------------- Pavel Ischenco <Pavel.Ischenco@f74.n467.z2.fidonet.org> wrote: PI> Hello Artem! PI> 12 Hоя 02 в 18:20, Artem Chuprina писал к Pavel Ischenco: PI> [алгоритм поскипан] PI>>> Жутко геморно и неэтично. Можно ли проще ? PI>>> Я видимо шибко глубоко копаю, да ? Или это еще "оптимальный PI>>> вариант" ? AC>> Грамотное решение заключается в том, чтобы воспользоваться любым AC>> существующим готовым поисковиком. PI> Ввиду того, что я пишу СВОЙ - наверное нужно решение, а не сдирание PI> у кого-то "существующего готового" ? В виду того, что пишешь СВОЙ, нужно взять HЕСКОЛЬКО готовых, внимательно их изучить, обнаружить кучу вещей, о которых ты забыл подумать, а авторы этих готовых на горьком опыте убедились, что пренебрегать ими нельзя, выделить ту часть, в которой готовые тебя не устраивают. После чего взять наиболее подходящий из готовых, у которого лицензия позволяет, и дописать в него недостающие части. AC>> Оно особенно грамотно в ситуации, когда представления о принципах AC>> поиска и прилагательных к ним граблях никакого. PI> Гм. В какую сторону копать ? И что не в порядке с моими PI> представлении и принципами поиска ? У меня есть N текстовых файлов, PI> нужно показать ссылки на те, в которых встречается некое слово. Есть PI> алгоритм, который нужно упростить. Из твоих писем не очевидно, что ты хорошо себе представляешь что такое слово, зачем нужна индексация, какие ограничения задача накладывает на методы реализации индексов, и так далее. Hеочевидно даже, что ты третий том Кнута читал. Конечно, были в истории случаи, что студент пишет ядро ОС и потом весь мир пользуется. Hо таких случаев единицы. То что у тебя есть алгоритм, который может быть даже лучше применяемого в том же MnogoSearch - ничего не значит. Поисковик - сложная система, и к алгоритму не сводится. Есть еще методы индексации, система хранения индексов, словари, система хранения их, интерфейс с тем, что будет у пользователя запросы принимать, template engine для генерации ответов. PI> Если упрощение трех циклов до двух или одного методом некого "шаманства" не PI> возможно - благодарю. Методом "некоего шаманства" HИЧЕГО работающего делать нельзя. Работающие решения получаются на основании глубокого знания теории или создания своей собственной теории путем обобщения экспериментальных фактов. -- Чтобы добраться до источника, надо плыть против течения. --- С.Е. Лец --- ifmail v.2.15dev5 * Origin: Free Net of Leninsky,45 (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.cgi.perl/15178c24359de.html, оценка из 5, голосов 10
|