会议专题

一个可扩展的数据清洗系统

在给数据挖掘这样的应用准备数据的过程中,面临着一系列数据清洗问题.然而要把数据清洗过程做得很灵活并不那么简单,已有的工具往往过于依赖特定的应用.该文提出并实现了一个可扩展的数据清洗框架.它以术语模型、处理描述文件、共享库等概念和技术实现了模块的高度独立和系统的可扩展性,并提供了一个可视化的流程定义环境.

数据准备 数据清洗 术语模型 数据库

俞荣华 郭志懋 田增平 周傲英

复旦大学计算机系(上海)

国内会议

第18届全国数据库学术会议

南宁

中文

152-156

2001-05-01(万方平台首次上网日期,不代表论文的发表时间)