会议专题

数据时效性判定问题的求解算法

  数据的时效性问题是影响数据质量的重要因素之一。时效性差的数据会对企业决策和人们的日常生活带来许多不利影响,这使得判定数据的时效性成为必要。许多应用数据库中都没有完整、清洁、可用的时间戳,从而导致数据时效性的判定非常困难。冗余记录和时效约束能够在时间戳缺失的情况下有效地辅助恢复数据的时序关系,因而能够帮助数据时效性的判定。文中研究包含冗余记录的集合在给定时效约束下的时效性判定问题,并首次提出了时效性判定问题的求解算法。首先,文中定义了查询相关时效性和用户相关时效性。在判定查询相关时效性时,文中将查询归结为最新值查询和时效序列查询两类,并分别根据两类查询的特点,对每类查询定义了查询结果时效性和平均时效性。然后,文中提出了时效图的概念。利用时效图,文中给出了查询相关时效性和用户相关时效性判定问题的求解算法。最后给出了真实数据和虚拟数据上的实验结果,验证了文中算法较高的执行效率,并分析了各个参数对算法的影响。

数据质量 数据时效性 相关时效性

李默涵 李建中 高宏

哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001

国内会议

2012中国计算机大会

大连

中文

2348-2360

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)