一种基于计数与分层策略的异构数据索引方法
随着大数据时代的到来,数据正呈现量大、类型繁多、价值密度低等特征,因此快速且有效地发现异构数据中有价值的信息将极具挑战,其中,构建支持多种类型数据的索引是主要的研究方向之一.当前,异构数据索引方法缺乏效率,即查询语言复杂且大多仅考虑单一项(关键词或属性).为此,提出了一种新型异构数据索引方法.首先,为简单、灵活、统一地描述结构化、非结构化数据,提出了一种基于关键词描述的数据模型.其次,充分利用剪枝及关键词计数策略,提出了一种基于计数和分层策略的异构数据索引技术,有效地提高了索引效率.基于提出的索引,设计了一种基于计数和回溯机制的查询处理算法,既保证了查询结果的准确性,又能改善查询的性能.最后,通过实验验证了该方法的可行性和有效性.
异构数据 索引技术 查询算法 计数策略 分层策略 回溯机制
祝官文 周连科 王念滨 王红滨
哈尔滨工程大学计算机科学与技术学院 哈尔滨 150001
国内会议
太原
中文
86-93
2014-09-19(万方平台首次上网日期,不代表论文的发表时间)