Главная страница


ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Oleg Khovayko [SPAM trap - don't re  2:5020/400     31 May 2003  05:01:56
 To : Alex Astafiev
 Subject : Re: Hечеткое сравнение строк
 -------------------------------------------------------------------------------- 
 
 В моей подсистеме нечеткого поиска,
 примененной в базах данных MeSH & Journals:
 
 http://www.ncbi.nih.gov/entrez/query.fcgi?db=mesh
 http://www.ncbi.nih.gov/entrez/query.fcgi?db=journals
 
 используется метод триграмм.
 Смысл метода -- похожие строки должны также иметь
 похожие подстроки.
 У меня строки разбиваются на подстроки длиной 3 "вперекрышку",
 после чего критерием похожести является множество точного
 совпадения подстрок.
 
 Исходники моей fuzzy-байды и краткие комментарии к ней
 можно найти на http://itman.narod.ru
 Ищите описание метода Вилбура-Ховайко.
 
 Работает мой fuzzy-подсистема довольно быстро: на
 старом UltraSparcII, с 256mb ОЗУ и 220 MHZ
 процессором, в словаре из 14 миллионов строк
 находит 100 похожих и выводит список,
 сортированый в порядке похожести, за 0.2 секунды.
 Словарь, естественно, преиндексирован.
 Индексация словаря - порядка 15 минут.
 
 А насколько адекватно работает - судить Вам.
 Идите на вышеуказаные URL-и, вводите в строку поиска
 всякие слова или фразы, и смотрите "suggestions"...
 
 -- 
 #include <best/regards>
 Oleg Khovayko  http://olegh.spedia.net
 PS/ATTN: Reply to reverted address net.comcast@olegh
 
 --- ifmail v.2.15dev5
  * Origin: http://www.ftc.gov/opa/2001/04/spam.htm (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Hечеткое сравнение строк   Yuri Burger   27 May 2003 09:34:19 
 Hечеткое сравнение строк   Andrew Kirillov   27 May 2003 16:47:47 
 Re: Hечеткое сравнение строк   Sergiy Kanilo   27 May 2003 22:19:51 
 Re: Hечеткое сравнение строк   Yuri Burger   28 May 2003 15:25:04 
 Re: Hечеткое сравнение строк   Sergiy Kanilo   28 May 2003 21:57:33 
 Re: Hечеткое сравнение строк   Yuri Burger   29 May 2003 12:00:21 
 Re: Hечеткое сравнение строк   Sergiy Kanilo   29 May 2003 18:01:43 
 Hечеткое сравнение строк   Alex Astafiev   28 May 2003 17:42:21 
 Re: Hечеткое сравнение строк   Yuri Burger   30 May 2003 14:28:30 
 Re: Hечеткое сравнение строк   Yuri Burger   30 May 2003 14:40:15 
 Hечеткое сравнение строк   Anton Maydell   30 May 2003 16:15:03 
 Re: Hечеткое сравнение строк   Sergey Andrianov   09 Jun 2003 22:20:02 
 Re: Hечеткое сравнение строк   Oleg Khovayko [SPAM trap - don\'t re   31 May 2003 05:01:56 
Архивное /ru.algorithms/5488c891eb1f.html, оценка 3 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional