|
|
ru.algorithms- RU.ALGORITHMS ---------------------------------------------------------------- From : Alex Astafiev 2:5000/228.16 08 Apr 2003 01:35:18 To : "Oleg Khrulev" Subject : Разбор почтового адреса. -------------------------------------------------------------------------------- OK> Имеет ли смысл строить такие промежуточные таблицы? : OK> OK> #клиента1 OK> #клиента2 OK> коэф_совпадения_фамилий OK> коэф_совпадения_адресов OK> коэф_совпадения_индексов OK> общий_коэф_совпадения В любом случае, в правильно спроектированных реляционных DB никакие промежуточные таблицы не используются, это исключительно дурной стиль и источник аномалий. если вы называете промежуточными таблицами журналирование результатов работы, то это не требуется. OK> Куда вносить пары клиентов, у которых хотя бы один коэффициент OK> совпадения близок к единице. пары - никуда не заносить. зачем это? какую информацию это даст/содержит? 100% достоверность помечается как "полностью опознан", < 100% помечается как "тут есть проблема". Это происходит на каждом шаге, который сепарирует достоверную информацию от недостоверной. Hа каждом шаге эта оценка меняется у ОСТАВШИХСЯ записей, вернее у ТЕКУЩЕЙ "сырой" записи, обрабатываемой в данный момент. Эта информация извлекается из соотношения настройки*<известное достоверное множество> Kдост = ----------------------------------------------- <известное недостоверное множество> Каждый шаг сепарации инициируется оператором, как я это и писал вам. OK> Вобщем как можно все это оптимизировать? Это уже как раз ваша работа за которую платят деньги. OK> --------------------------------------------------------------------- OK> - OK> ------- Так как задача разбора почтового адреса достаточно типична, OK> возможно кому-то будет полезен список ссылок, посвященных этой OK> проблеме: thnx. ps. на чем клиентская часть пишется? (в нетмайл pls) p.p.s есть эхи типа SU.DBMS, SU.DBMS.ORACLE 0 error(s), 0 warning(s) --- * Origin: Alex Raider / Я маленький, играю в ФИДО. (2:5000/228.16) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.algorithms/174643e92379b.html, оценка из 5, голосов 10
|