|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Andrew Ezhguroff 2:5020/400 27 Sep 2001 19:14:20 To : Dmitry Kolvakh Subject : Re: Фильтp для базаpа -------------------------------------------------------------------------------- Привет! "Dmitry Kolvakh" <Dmitry.Kolvakh@p18.f4400.n5020.z2.fidonet.org> сообщил(а) нам: > Если pешать задачу в лоб, то можно пpосто оpганизовать табличку со всеми > коpнями нежелательных словей с учетом возможных падежов. Hо во-пеpвых, pусский > язык слишком /велик/ и могуч, во-втоpых - могут возникнуть некотоpые > лингвистические пpоблемы, когда будут выpезаться самые безобидные слова. Язык конечно могуч, но матерных корней - вроде бы меньше десяти (во всяком случае по заявлению профессионального лингвиста, а вот какие именно - это не ко мне). Так что особых проблем быть не должно. В крайнем случае, сделай полуавтомат: при нахождении неизвестного, но подозрительного слова спрашивать оператора. И если слово "цензурное", то заносить его в словарь разрешенных слов (т.к. спорных случаев немного, то и второй словарь будет небольшим). С уважением, Андрей. --- ifmail v.2.15dev5 * Origin: COMSTAR Telecommunications (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/12168d6691e6e.html, оценка из 5, голосов 10
|