|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Roman Sandakov 2:5080/41 31 Jul 2003 11:26:17 To : Dmitry Nikolaev Subject : создать словарь слов --------------------------------------------------------------------------------
> From: "Dmitry Nikolaev" <u1028638@dialup.podolsk.ru>
>
> Я Решил сделать словарь, чтобы потом использовать его
> для подбора паролей, разгадывания кроссвордов итп.
> взял книгу.txt и повыдирал оттуда все слова..
> отсеял одинаковые..
> а вот как отсеять варианты типа
> паравоз
> паравозов
> паравозе итп
> .когда надо оставить лишь паравоз!
> как бы выполнить такое, с минимальными потерями и ошибками..
> просто хочется чтобы словарь был словарем, а не сборищем мусора.
> p.s. ссылки на уже готовые словари не нужны, хочется самому как-то.
Самому не получится (раз уж ты сюда написал).
Берёшь справочник русского языка и оттуда все
склонения, спряжения,
изменения по временам, числам, родам, падежам
забиваешь в программу.
а потом для каждого слова указываешь, какая это часть речи,
и, по необходимости, какого она склонения/спряжения.
Потом генеришь из каждого слова книгу.txt все его формы, ищешь и выкидываешь
их.
Я где-то очень давно (году в 91м) видел подобную проверку орфографии.
Ах да! она так и называлась "Орфо"! Ориентированна была как раз на русский
язык.
Работала она _гораздо_ эффективнее, чем все современные поделушки
мелкософта.
Так что советую поискать.
Она была самообучающейся. при натыкании на неизвестное слово спрашивала,
про его часть речи и прочее, причём для этого склоняла и спрягала все слова
по всем
возможным правилам, и осведомлялась у пользователя, что ему более по душе.
Очень забавно было с ней работать.
Только полученный словарь тебе не подберёт пароль типа "пошёл_в_ж@#у".
--- InterSquish NNTP Server/FTN Gate
* Origin: ... Authorial Technologies, Ltd. ... (2:5080/41)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/18103f28a879.html, оценка из 5, голосов 10
|