Frozen Fido : RU.ALGORITHMS : Лингвистический разбор

ru.algorithms

 
 - RU.ALGORITHMS ----------------------------------------------------------------
 From : Vladimir V. Dozorov                  2:5036/1       08 Apr 2002  12:38:51
 To : All
 Subject : Лингвистический разбор
 --------------------------------------------------------------------------------

 Привет!
 
 Стоит задача:
 - есть - краткие текстовые описания тем лекций.
 - необходимо - получить последовательность этих тем, упорядоченную по
 количеству встречающихся терминов в других темах, т.е. сначала идет тема,
 термины из которой встречаются встретились болбшее число раз в других темах,
 замыкает все это дело тема, термины из которой не встретились ни разу 
 (встретились минимальное число раз).
 
 Как это реализовать? Может есть что-то подобное?
 
 Свои идеи:
 Взять составить матрицу A,NxN (N - число тем), элемент Aij которой - число 
 _терминов_ (а не их частота) i-й темы в j-ой теме. Затем выбрать ту, сумма 
 по строке которой дает максимум, и так далее по снижению. При равной сумме 
 первой берется та, термины которой встретились в большем числе тем.
 
 Так вот проблема собственно состоит в том, чтобы произвести поиск слов темы 
 в остальных. 
 Даже, если темам придать ключевые слова, то сложность отыскать их в других 
 словоформах, а в имеющемся виде сначала надо еще выделить термины из общего 
 текста - отбросить предлоги, союзы, окончания, приставки, суффиксы.
 Hасколько я понимаю, здесь подобие того, как реализован поиск на поисковиках -
 но как? 
 
 Посоветуйте, куда смотреть, как поступить? 
 
 С уважением, Владимир
 --- ifmail v.2.14dev3
  * Origin: Lipetsk State Technical University (2:5036/1@fidonet)

Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор

Тема:	Автор:	Дата:
Лингвистический разбор	Vladimir V. Dozorov	08 Apr 2002 12:38:51
Лингвистический разбор	Andrew Aksyonoff	08 Apr 2002 17:57:53
Лингвистический разбор	Alexander Chelmodeev	09 Apr 2002 14:20:14
Лингвистический разбор	Alexander Chelmodeev	09 Apr 2002 14:26:24
Re: Лингвистический разбор	Maxim Volkonovsky	09 Apr 2002 22:06:33
Re: Лингвистический разбор	Vladimir V. Dozorov	10 Apr 2002 09:11:34
Лингвистический разбор	Alexander Chelmodeev	10 Apr 2002 11:05:34
Re: Лингвистический разбор	Maxim Volkonovsky	10 Apr 2002 19:37:44
Лингвистический разбор	Alex Astafiev	11 Apr 2002 14:10:48
Лингвистический разбор	Nickita A Startcev	10 Apr 2002 14:01:12
Re: Лингвистический разбор	Andrew Ezhguroff	11 Apr 2002 12:11:37
Лингвистический разбор	Alex Astafiev	11 Apr 2002 14:07:24
Лингвистический разбор	Alexander Chelmodeev	11 Apr 2002 22:24:35
Лингвистический разбор	Alex Astafiev	12 Apr 2002 12:23:32
Лингвистический разбор	Igor Glukharev	11 Apr 2002 18:45:39

Архивное /ru.algorithms/137642f7e5e9b.html, оценка 2 из 5, голосов 10