Главная страница


ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Maxim Volkonovsky                    2:5020/982.299 10 Apr 2002  19:37:44
 To : Alexander Chelmodeev
 Subject : Re: Лингвистический разбор
 -------------------------------------------------------------------------------- 
 
 
 Wednesday April 10 2002 11:05, Alexander Chelmodeev (2:5062/17.5@fidonet) wrote 
 to Maxim Volkonovsky:
 
  MV>> Есть довольно интересная технология, описанная в американском патенте
  MV>> 5418951. Она позволяет сравнивать на семантическую "похожесть"
  MV>> произвольные тексты на произвольном языке без словаря.
  AC>      А вкратце не можешь рассказать?
 
 Вкратце: из текста выкидываются все не-буквы, он разбивается на
 последовательность "н-грамм" с шагом в одну букву, и по этим "н-граммам"
 вычисляется нормированная статистика распределения. Утверждается, что для
 семантически похожих текстов эта статистика также будет похожа.
 
 Метод очень быстрый, но реально, на мой взгляд, годится только для
 предварительной оценки, поскольку практически отсутствует возможность уточнения 
 характеристики похожести.
 Сам патент легко получается на:
 
 http://patft.uspto.gov/netahtml/srchnum.htm
 
 только нужно иметь браузер или плагин, поддерживающий компрессированный TIFF,
 поскольку патенты там хранятся в виде сканов страниц.
               Best wishes ! Max (aka MaxWolf)
 
 --- GoldED+/W32 1.1.4.7
  * Origin: MaxWolf's mobile station (2:5020/982.299)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Лингвистический разбор   Vladimir V. Dozorov   08 Apr 2002 12:38:51 
 Лингвистический разбор   Andrew Aksyonoff   08 Apr 2002 17:57:53 
 Лингвистический разбор   Alexander Chelmodeev   09 Apr 2002 14:20:14 
 Лингвистический разбор   Alexander Chelmodeev   09 Apr 2002 14:26:24 
 Re: Лингвистический разбор   Maxim Volkonovsky   09 Apr 2002 22:06:33 
 Re: Лингвистический разбор   Vladimir V. Dozorov   10 Apr 2002 09:11:34 
 Лингвистический разбор   Alexander Chelmodeev   10 Apr 2002 11:05:34 
 Re: Лингвистический разбор   Maxim Volkonovsky   10 Apr 2002 19:37:44 
 Лингвистический разбор   Alex Astafiev   11 Apr 2002 14:10:48 
 Лингвистический разбор   Nickita A Startcev   10 Apr 2002 14:01:12 
 Re: Лингвистический разбор   Andrew Ezhguroff   11 Apr 2002 12:11:37 
 Лингвистический разбор   Alex Astafiev   11 Apr 2002 14:07:24 
 Лингвистический разбор   Alexander Chelmodeev   11 Apr 2002 22:24:35 
 Лингвистический разбор   Alex Astafiev   12 Apr 2002 12:23:32 
 Лингвистический разбор   Igor Glukharev   11 Apr 2002 18:45:39 
Архивное /ru.algorithms/47623cb45eeb.html, оценка 3 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional