|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Sergey Skornyakov 2:5020/400 27 Sep 2001 19:24:39 To : Andrew Ezhguroff Subject : Фильтp для базаpа -------------------------------------------------------------------------------- Hello, Andrew! You wrote to Dmitry.Kolvakh@p18.f4400.n5020.z2.fidonet.org on Thu, 27 Sep 2001 15:14:20 +0000 (UTC): ??>> Если pешать задачу в лоб, то можно пpосто оpганизовать табличку со ??>> всеми коpнями нежелательных словей с учетом возможных падежов. Hо ??>> во-пеpвых, AE> pусский ??>> язык слишком /велик/ и могуч, во-втоpых - могут возникнуть некотоpые ??>> лингвистические пpоблемы, когда будут выpезаться самые безобидные ??>> слова. AE> Язык конечно могуч, но матерных корней - вроде бы меньше десяти (во AE> всяком случае по заявлению профессионального лингвиста, а вот какие AE> именно - это не ко мне). Так что особых проблем быть не должно. В AE> крайнем случае, сделай полуавтомат: при нахождении неизвестного, но AE> подозрительного слова спрашивать оператора. И если слово "цензурное", AE> то заносить его в словарь разрешенных слов (т.к. спорных случаев AE> немного, то и второй словарь будет небольшим). А как быть, скажем, со словом "сука"? IMO, без учета контекста не слишком здорово получится. Best regards, Sergey. --- ifmail v.2.15dev5 * Origin: posted via PTT-Teleport ISP, AS6795 (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/5500d001a822.html, оценка из 5, голосов 10
|