Главная страница


ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Igorek Filimonov                     2:5020/238.1   06 Oct 2001  15:05:30
 To : Dmitry Kolvakh
 Subject : Фильтp для базаpа
 -------------------------------------------------------------------------------- 
 
 
  Dmitry Kolvakh wrote for Alex Astafiev & All:
 
  DK> [...skipped...]
  DK> С неподдельным интеpесом читаю высказываемые здесь
  DK> мнения, но суть в том, что сабж нужен для CGI-шки,
  DK> гостевая книга. Т.е. pаботать должен  _быстpо_ и с
  DK> минимальными тpебованиями с pесуpсам компа.
 
    Я вот тут читаю дискуссию, и мне кажется, что сама
 постановка вопроса при данной задаче не верная.
 Практически ведь нужно избавиться от мата с форуме, и
 всё... Я бы решал задачу примерно следующим образом:
 1) Создаётся несложный анализатор текста, который
 просматривает получаемое сообщение, проверяет, есть
 ли в нём недопустимая речь (см. ниже).
 2) В случае, если система обнаруживает, что употреблены
 недопустимые выражения, ip-адрес отправителя, тело
 сообщения и время заносятся в специальный список.
 3) Когда системе приходит запрос на чтение форума,
 система смотрит, не находится ли ip-адрес запрашивающей
 системы в списке (в списке адреса хранятся несколько часов).
 Если нет - отсылается "чистая" версия базы сообщений, не
 содержащая писем с недопустимой лексикой. Если же ip-адрес
 есть в системе - то посылается изменённая база, вместе
 с теми письмами, которые были отправлены с этого адреса
 и содержали недопустимую лексику.
 
     И вот чем хороша такая система:
     Когда человек напишет чего-нибудь матом, и увидит, что
 его письмо было процензурировано, в нём вполне может проснуться
 "хакерский инстинкт" и он начнёт "отлаживать" работу этой
 системы - не для того, чтобы поругаться, а просто из азарта.
 А если человек пишет письмо, и думает, что оно успешно
 попало в форум, и исчезло оттуда не сразу - он и не поймёт,
 в чём дело, а даже если и поймёт - то ломать такую систему
 ему будет уже значительно труднее, так как постоянно придётся
 менять ip-адреса. (естественно, что пользователям не нужно
 сообщать о наличии подобной системы, всё должно происходить
 прозрачно, чтобы с случае чего люди свалили всё на
 цензора-человека)
                  
    Анализатор - вещь тоже, в общем то, не сложная. 
 Hа практике достаточно составить словарь запрещённых основ
 слов в виде корня с приставкой, но без суффикса и окончания
 (предварительно нужно латинские буквы и цифры заменить на
 похожие русские, большего, IMHO, не требуется). Таких
 основ немного, меньше 100 - если же концовку тоже хранить,
 то слов будет слишком много, из-за всяких родов, падежей,
 залогов, времён и кучи чего ещё.
               
    
                With respect,  Игоpь Филимoнов.
       
 PGP key fingerprint:  28 B2 CB 8A 85 F6 82 1A   FC 8E BE B0 91 61 C9 68
 ... Hе плюсуй, ибо сам заплюсован будешь.
 --- Blue Wave/386 v2.30
  * Origin: InfoScience BBS user's message (2:5020/238.1)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Фильтp для базаpа   Dmitry Kolvakh   27 Sep 2001 12:08:52 
 Re: Фильтp для базаpа   Andrew Ezhguroff   27 Sep 2001 19:14:20 
 Фильтp для базаpа   Sergey Skornyakov   27 Sep 2001 19:24:39 
 Re: Фильтp для базаpа   Andrew Ezhguroff   27 Sep 2001 22:26:04 
 Фильтp для базаpа   Dmitry Kolvakh   01 Oct 2001 15:47:55 
 Фильтp для базаpа   Igor Dolgov   02 Oct 2001 19:37:25 
 Фильтp для базаpа   George Shepelev   05 Oct 2001 22:27:50 
 Re: Фильтp для базаpа   Andrew V. Fionik   27 Sep 2001 22:01:35 
 Re: Фильтp для базаpа   Comoderator Of Ru Algorithms   28 Sep 2001 16:27:50 
 Фильтp для базаpа   Alex Astafiev   30 Sep 2001 16:11:49 
 Фильтp для базаpа   Dmitry Kolvakh   01 Oct 2001 15:52:09 
 Фильтp для базаpа   Alex Astafiev   02 Oct 2001 18:44:33 
 Re: Фильтp для базаpа   Andrew Doroshew   03 Oct 2001 09:40:57 
 Фильтp для базаpа   Alex Astafiev   04 Oct 2001 18:22:30 
 Re: Фильтp для базаpа   Andrew Doroshew   05 Oct 2001 09:11:14 
 Фильтp для базаpа   Dmitry Kolvakh   05 Oct 2001 10:57:33 
 Фильтp для базаpа   Alex Astafiev   07 Oct 2001 02:40:22 
 Фильтp для базаpа   Dmitry Kolvakh   08 Oct 2001 17:33:43 
 Фильтp для базаpа   George Shepelev   06 Oct 2001 16:28:40 
 Фильтp для базаpа   Dmitry Kolvakh   05 Oct 2001 10:53:23 
 Фильтp для базаpа   Igorek Filimonov   06 Oct 2001 15:05:30 
 Фильтp для базаpа   Dmitry Kolvakh   08 Oct 2001 17:26:54 
 Фильтp для базаpа   George Shepelev   08 Oct 2001 11:04:21 
 Фильтp для базаpа   Alex Astafiev   07 Oct 2001 02:46:41 
 Фильтp для базаpа   Dmitry Kolvakh   08 Oct 2001 17:34:38 
 Re^2: Фильтp для базаpа   Vadim Goncharov   06 Oct 2001 22:29:27 
 Re: Фильтp для базаpа   Maxim Zakharov   07 Oct 2001 17:54:03 
Архивное /ru.algorithms/32913bbfe337.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional