|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Maxim Volkonovsky 2:5020/982.299 09 Apr 2002 22:06:33 To : Alexander Chelmodeev Subject : Re: Лингвистический разбор --------------------------------------------------------------------------------
Tuesday April 09 2002 14:26, Alexander Chelmodeev (2:5062/17.5@fidonet) wrote to
Vladimir V. Dozorov:
AC> В некоторых случаях можно либо: 1. исключить и прилагательные,
AC> глаголы и наречия, либо выделять не отдельные слова, а словосочетания (2-4
AC> слова). Hапример, у меня так: строю частотный словарь, а затем выбираю
AC> 100 слов с максимальной частотой, исключая слова из "стоп-словаря".
Есть довольно интересная технология, описанная в американском патенте 5418951.
Она позволяет сравнивать на семантическую "похожесть" произвольные тексты на
произвольном языке без словаря.
Best wishes ! Max (aka MaxWolf)
--- GoldED+/W32 1.1.4.7
* Origin: MaxWolf's mobile station (2:5020/982.299)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/47623cb32e2e.html, оценка из 5, голосов 10
|