Frozen Fido : RU.CGI.PERL : Re: site search

ru.cgi.perl

 
 - RU.CGI.PERL ------------------------------------------------------------------
 From : Konstantin Tokar                     2:5020/400     14 Nov 2002  13:03:00
 To : Pavel Ischenco
 Subject : Re: site search
 --------------------------------------------------------------------------------

 
 > Есть N html-файлов, разбросанных по разным каталогам.
 > Пути закинуты в массив в виде:
 >  /bla/files/1.shtml
 >  /bla-bla/files_b/sh.shtml
 > etc.
 > Hужно организовать по ним поиск включение некого кейворда.
 >
 > Идея реализации: Вычленяем кейворд, берем путь к файлу из массива, 
 > открываем,
 > запихиваем в другой массив с разбивкой по \n, в цикле каждую строку 
 > (по словам)
 > перебираем вложенным циклом на предмет сопоставления с кейвордом...
 >
 > Жутко геморно и неэтично. Можно ли проще ?
 > Я видимо шибко глубоко копаю, да ? Или это еще "оптимальный вариант" ?
 
 Ты копаешь мелко. Если файлов больше пары десятков и нужен язык 
 запросов, морфология и вообще будущее развитие, то надо слушать советы 
 которые уже были. Твой алгоритм можно улучшить примерно так:
 
 #!perl -w
 use strict;
 use File::Slurp;
 my $files = shift; #список файлов
 my $keyword=shift;
 open FILES, '<' . $files or die($@);
 while( my $filename = <FILES> ){ #как было установлено, в каком-то перле 
 эта конструкция незаконна, но мы на это пока наплюём
          chomp $filename;
          next unless -f $filename;
   my $s = read_file($filename);
   print "$filename\n" if $s =~ /$keyword/io;
 }
 close FILES;
 
 а потом разбираться с безпасностью, регулярными выражениями (или просто 
 index) и так далее до понимания причины повсеместного использования 
 поисковых систем.
 
 --- ifmail v.2.15dev5
  * Origin: Demos online service (2:5020/400)

Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор

Тема:	Автор:	Дата:
site search	Pavel Ischenco	12 Nov 2002 06:34:12
Re: site search	Artem Chuprina	12 Nov 2002 19:20:33
Re: site search	Pavel Ischenco	13 Nov 2002 10:35:54
Re: site search	Artem Chuprina	14 Nov 2002 04:00:25
Re: site search	Pavel Ischenco	14 Nov 2002 04:07:44
Re: site search	Serge Pekarsky	15 Nov 2002 15:41:14
Re: site search	Artem Chuprina	15 Nov 2002 16:18:41
Re: site search	Alex Povolotsky	18 Nov 2002 17:29:58
site search	Ruslan Bondarev	15 Nov 2002 00:16:01
site search	Sergej Tarasov	15 Nov 2002 04:17:55
site search	Ruslan Bondarev	15 Nov 2002 22:02:33
Re: site search	Victor Wagner	15 Nov 2002 10:55:21
Re: site search	Sergej Tarasov	15 Nov 2002 20:57:23
Re: site search	Andrey Savitsky	15 Nov 2002 12:05:12
site search	Ruslan Bondarev	15 Nov 2002 21:56:08
Re: site search	Artem Chuprina	15 Nov 2002 16:19:43
site search	Ruslan Bondarev	15 Nov 2002 22:00:17
Re: site search	Victor Wagner	14 Nov 2002 11:36:22
Re: site search	Konstantin Tokar	14 Nov 2002 13:03:00
Re: site search	Andrey Savitsky	15 Nov 2002 12:01:58

Архивное /ru.cgi.perl/6577193bb6c0.html, оценка 1 из 5, голосов 10