|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Alex Astafiev 2:5000/228.16 11 Apr 2002 14:10:48 To : Maxim Volkonovsky Subject : Лингвистический разбор --------------------------------------------------------------------------------
MV>>> Есть довольно интересная технология, описанная в американском
MV>>> патенте 5418951. Она позволяет сравнивать на семантическую
MV>>> "похожесть" произвольные тексты на произвольном языке без
MV>>> словаря.
AC>> А вкратце не можешь рассказать?
MV>
MV> Вкратце: из текста выкидываются все не-буквы, он разбивается на
MV> последовательность "н-грамм" с шагом в одну букву, и по этим
MV> "н-граммам" вычисляется нормированная статистика распределения.
MV> Утверждается, что для семантически похожих текстов эта статистика
MV> также будет похожа.
хе-хе, вот америкосы хитрожопые. может, они нашу эху читают, и знай -
патентуют, патентуют, патентуют... :)))))))))))
---
* Origin: Alex Raider/ Flash inc. 1992-2002 (2:5000/228.16)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/174643cb5a7b1.html, оценка из 5, голосов 10
|