Главная страница


ru.cgi.perl

 
 - RU.CGI.PERL ------------------------------------------------------------------
 From : Konstantin Tokar                     2:5020/400     14 Nov 2002  13:03:00
 To : Pavel Ischenco
 Subject : Re: site search
 -------------------------------------------------------------------------------- 
 
 
 > Есть N html-файлов, разбросанных по разным каталогам.
 > Пути закинуты в массив в виде:
 >  /bla/files/1.shtml
 >  /bla-bla/files_b/sh.shtml
 > etc.
 > Hужно организовать по ним поиск включение некого кейворда.
 >
 > Идея реализации: Вычленяем кейворд, берем путь к файлу из массива, 
 > открываем,
 > запихиваем в другой массив с разбивкой по \n, в цикле каждую строку 
 > (по словам)
 > перебираем вложенным циклом на предмет сопоставления с кейвордом...
 >
 > Жутко геморно и неэтично. Можно ли проще ?
 > Я видимо шибко глубоко копаю, да ? Или это еще "оптимальный вариант" ?
 
 Ты копаешь мелко. Если файлов больше пары десятков и нужен язык 
 запросов, морфология и вообще будущее развитие, то надо слушать советы 
 которые уже были. Твой алгоритм можно улучшить примерно так:
 
 #!perl -w
 use strict;
 use File::Slurp;
 my $files = shift; #список файлов
 my $keyword=shift;
 open FILES, '<' . $files or die($@);
 while( my $filename = <FILES> ){ #как было установлено, в каком-то перле 
 эта конструкция незаконна, но мы на это пока наплюём
          chomp $filename;
          next unless -f $filename;
   my $s = read_file($filename);
   print "$filename\n" if $s =~ /$keyword/io;
 }
 close FILES;
 
 а потом разбираться с безпасностью, регулярными выражениями (или просто 
 index) и так далее до понимания причины повсеместного использования 
 поисковых систем.
 
 --- ifmail v.2.15dev5
  * Origin: Demos online service (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 site search   Pavel Ischenco   12 Nov 2002 06:34:12 
 Re: site search   Artem Chuprina   12 Nov 2002 19:20:33 
 Re: site search   Pavel Ischenco   13 Nov 2002 10:35:54 
 Re: site search   Artem Chuprina   14 Nov 2002 04:00:25 
 Re: site search   Pavel Ischenco   14 Nov 2002 04:07:44 
 Re: site search   Serge Pekarsky   15 Nov 2002 15:41:14 
 Re: site search   Artem Chuprina   15 Nov 2002 16:18:41 
 Re: site search   Alex Povolotsky   18 Nov 2002 17:29:58 
 site search   Ruslan Bondarev   15 Nov 2002 00:16:01 
 site search   Sergej Tarasov   15 Nov 2002 04:17:55 
 site search   Ruslan Bondarev   15 Nov 2002 22:02:33 
 Re: site search   Victor Wagner   15 Nov 2002 10:55:21 
 Re: site search   Sergej Tarasov   15 Nov 2002 20:57:23 
 Re: site search   Andrey Savitsky   15 Nov 2002 12:05:12 
 site search   Ruslan Bondarev   15 Nov 2002 21:56:08 
 Re: site search   Artem Chuprina   15 Nov 2002 16:19:43 
 site search   Ruslan Bondarev   15 Nov 2002 22:00:17 
 Re: site search   Victor Wagner   14 Nov 2002 11:36:22 
 Re: site search   Konstantin Tokar   14 Nov 2002 13:03:00 
 Re: site search   Andrey Savitsky   15 Nov 2002 12:01:58 
Архивное /ru.cgi.perl/6577193bb6c0.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional