数据完整性的评估方法
随着信息技术的发展,数据的规模正在高速增长,数据中普遍存在质量问题.针对海量关系数据中普遍存在的数据不完整现象,研究了关系数据完整性度量问题.针对数据的完整性计算问题,提出了数据完整性计算模型,以及精确算法和基于均匀抽样的近似算法.理论分析证明了近似算法可以达到任意的精度要求,可以高效地对数据完整性进行计算.通过在DBLP数据上的实验验证了算法的有效性和高效性.
海量关系数据 完整性计算 算法有效性 评估方法
刘永楠 邹兆年 李建中 王海洁
哈尔滨工业大学计算机科学与技术学院 哈尔滨150001 哈尔滨工业大学网络与信息中心 哈尔滨150001
国内会议
哈尔滨
中文
230-238
2013-08-16(万方平台首次上网日期,不代表论文的发表时间)