|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Vladimir V. Dozorov 2:5036/1 08 Apr 2002 12:38:51 To : All Subject : Лингвистический разбор -------------------------------------------------------------------------------- Привет! Стоит задача: - есть - краткие текстовые описания тем лекций. - необходимо - получить последовательность этих тем, упорядоченную по количеству встречающихся терминов в других темах, т.е. сначала идет тема, термины из которой встречаются встретились болбшее число раз в других темах, замыкает все это дело тема, термины из которой не встретились ни разу (встретились минимальное число раз). Как это реализовать? Может есть что-то подобное? Свои идеи: Взять составить матрицу A,NxN (N - число тем), элемент Aij которой - число _терминов_ (а не их частота) i-й темы в j-ой теме. Затем выбрать ту, сумма по строке которой дает максимум, и так далее по снижению. При равной сумме первой берется та, термины которой встретились в большем числе тем. Так вот проблема собственно состоит в том, чтобы произвести поиск слов темы в остальных. Даже, если темам придать ключевые слова, то сложность отыскать их в других словоформах, а в имеющемся виде сначала надо еще выделить термины из общего текста - отбросить предлоги, союзы, окончания, приставки, суффиксы. Hасколько я понимаю, здесь подобие того, как реализован поиск на поисковиках - но как? Посоветуйте, куда смотреть, как поступить? С уважением, Владимир --- ifmail v.2.14dev3 * Origin: Lipetsk State Technical University (2:5036/1@fidonet) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/137642f7e5e9b.html, оценка из 5, голосов 10
|