|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Roman Maltsev 2:5000/256.31 05 Oct 2001 08:36:04 To : Alex Astafiev Subject : SoundEx --------------------------------------------------------------------------------
27 Sep 01 19:12, Alex Astafiev wrote to All:
AA> Смысл в том, что для многих букв можно найти пару по
AA> звучанию: з-с, м-н, б-п и т.д. Hа основе этого слово
AA> обрабатывается по определенному алгоритму и получается его
AA> код из четырех символов, если у другого слова получим такой
AA> же код, то можно с определенной долей уверенности говорить о
AA> том, что это одно и тоже слово, набранное с ошибкой:
AA> "конференция" - К686, а для слова "канфиренция" - тоже
AA> К686, пробуем дальше: канфаренция - К686
AA> кунфуренция - К686.
AA> По моему, не плохо !
Очень похоже на библиографический код, ну, который на книжках в библиотеке
пишут. Я как-то спрашивал про него у библиотекарей, они говорили, что там
специальный алгоритм подсчета этого кода из всех букв фамилии автора, и вообще,
все это стандартизовано (даже название говорили). Hаверняка это русский SoundEx
и есть. Так что, следует покопаться в библиографических стандартах.
PS: А реализацию сабжа все-таки стоит закинуть в эху, пусть даже английский
вариант.
Всего хорошего.
---
* Origin: * DailyHacking BBS * 7-383-236-7809 * 00:00- (2:5000/256.31@Fidonet)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/169843bbd80ea.html, оценка из 5, голосов 10
|