会议专题

改善数据仓库中数据质量的方法

研究了利用ETL调度以及校验的方式来提高数据仓库中数据质量的方法。首先,利用ETL调度原理实现教据的自动化调度,使数据成为一个流动的数据流,数据所在的教据库作为ETL流的起点,保存最终高质量数据的数据仓库作为ETL数据流的终点。其次,对于已经形成ETL数据流的数据生成流实例信息,对完成ETL流程处理的数据构造历史信息,从而保证能够对ETL流进行监控。构造自动化的校验程序,使数据流流过时校验程序能够纠正错误数据,最终达到获得高质量数据的目的,保证了数据仓库中数据的稳定性。

数据仓库 数据质量 数据流 校验程序

龙涛 戴牡红

湖南大学软件学院 长沙 410082

国内会议

2009国际信息技与应用论坛

成都

中文

424-426

2009-05-15(万方平台首次上网日期,不代表论文的发表时间)