会议专题

数据完整性的评估方法

随着信息技术的发展,数据的规模正在高速增长,数据中普遍存在质量问题.针对海量关系数据中普遍存在的数据不完整现象,研究了关系数据完整性度量问题.针对数据的完整性计算问题,提出了数据完整性计算模型,以及精确算法和基于均匀抽样的近似算法.理论分析证明了近似算法可以达到任意的精度要求,可以高效地对数据完整性进行计算.通过在DBLP数据上的实验验证了算法的有效性和高效性.

海量关系数据 完整性计算 算法有效性 评估方法

刘永楠 邹兆年 李建中 王海洁

哈尔滨工业大学计算机科学与技术学院 哈尔滨150001 哈尔滨工业大学网络与信息中心 哈尔滨150001

国内会议

第30届中国数据库学术会议

哈尔滨

中文

230-238

2013-08-16(万方平台首次上网日期,不代表论文的发表时间)