会议专题

Deep Web中基于查询松弛的数据集成研究

在Deep web环境中,如何解决查询失败并保证查询执行结果的数据质量已经成为一个重要的研究问题。本文针对这一问题,提出了基于查询松弛的查询计划生成与数据集成方法.本文中首先提出了基于对象属性重要度的查询松弛算法,通过属性分组树产生查询松弛计划以解决失败查询造成的数据质量问题.其次,本丈构建了查询结果数据集成模型对查询松弛产生的数据进行集成。数据集成中主要引入了基于查询松弛二次查询的属性补全策略和Top-k排序思想,这能够有效地在过滤冗余数据同时提高集成结果中对象属性的完整性。最后,通过实验数据表明本文提出的方法对于保证多数据源查询结果的记录数量与数据质量具有较好效果。

数据集成 查询松弛 属性补全 数据质量 web环境

聂铁铮 申德荣 于戈 刘楠 单菁

东北大学 信息科学与工程学院,辽宁省 沈阳市 110004

国内会议

2009中国计算机大会

天津

中文

696-708

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)