|
|
su.dbms- SU.DBMS ---------------------------------------------------------------------- From : Gregory Kudinov 2:5020/400 23 Nov 2002 15:20:36 To : Michael Subject : Re: А вы сталкивались с проблемами с качеством данных? -------------------------------------------------------------------------------- Здравствуй, Михаил > GK> 2. Как обстоит дело с обеспечением КД в современных СУБД. Вроде > GK> все производители, что стали на нелегкий путь создания Data Warehouse > GK> систем с OLAP должны озаботиться этой проблемой. > GK> Какие пакеты есть, ну, например у Oracle, > > в общем ни каких или все, что в Oracle есть, начиная с check constraint и > т.п. Зависит от точки зрения А какие нибудь рекомендации они дают? Или может там есть модули нацеленные на КД. Вообще, в Oracle 9i используется понятие КД (data quality)? И если да, то в каком контексте. (извини, если вопрос не по адресу, но может кто-то еще заметит и ответит...) > GK> а у остальных? Особенно > GK> интересно приходилось ли кому-нибудь ими пользоваться, или проще > GK> свое писать? Может вместе с модулями КД они еще и какую-то > GK> теорию обеспечения КД под свой инструментарий подводят? > > http://www.trilliumsoft.com/ Изучаю. > GK> А то кого не спрошу - все только на Липаева кивают, мол он и его > GK> ученики качеством ПО в стране занимаются. А Липаев сказал, что не > GK> знает никого, кто бы в стране занимался конкретно КД. > GK> Hеужели теория КД чисто буржуйский вид спорта? > > Как ты сам сказал: "все производители, что стали на нелегкий путь создания > Data Warehouse систем с OLAP должны озаботиться этой проблемой." Переформулирую вопрос: а кто на Руси встал на нелегкий путь создания Data Warehouse систем с OLAP? > GK> 4. Опять же чрезвычайно интересно узнать о типичных граблях и любимых > GK> мозолях, связанных с КД. С какими проблемами общего вида приходилось > GK> сталкиваться и как они разрешались (или не разрешались ;-( > > Есть технические проблемы и есть проблемы связанные с бизнесом. Бизнес > проблемы - они специфичны. Технические, на мой взгляд, очевидны. Hу > например при загрузке в Data Warehouse обязательное поле не заполнено. > Как возможное решение - используется некое "внутресистемное" значение для > null. Все описания есть в metadata repository. Hа его основе создается отчет и > принимается решение - устраевает данное качество данных или нет. А как отличить поле, которое не заполнил оператор от поля, которого не было в исходном документе? По-моему NULL скрадывает эти различия, так как изначально не для этого создавался.. В реальной жизни в грамотных анкетах можно указать не только не знаю, но и "неприменимо". С уважением, Григорий --- ifmail v.2.15dev5 * Origin: MTU-Intel ISP (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /su.dbms/9104084d55d4.html, оценка из 5, голосов 10
|