TDCOL:列式存储的XML关键字查询处理策略
针对已有方法在XML数据上基于SLCA语义处理查询时存在的冗余计算问题,提出了一种基于列存储的倒排索引CList,用于避免已有方法的倒排表中相同数据重复存储的问题。基于CList,提出了一种自顶向下的查询处理算法TDCOL来提升系统的处理性能。对于给定查询Q=”k1,k2,…km”的每个公共祖先结点,TDCOL在保证仅处理一次的情况下即可得到所有满足条件的结果,因而将时间复杂度降为O(m×|LID1×1b|Skmaxch(v)|),其中|LID1|是Q的最短倒排表中包含的不同ID值的数目,Skmaxch(v)是所有被处理结点的包含关键字的孩子结点集中的最大集合。最后通过比较各种指标,从不同角度对TDCOL算法的性能优势进行了验证。
数据库系统 列式存储 可扩展标记语言 关键字查询 性能优化
ZHOU Junfeng 周军锋 TIAN Shanshan 田姗姗 LAN Guoxiang 蓝国翔 CHEN Ziyang 陈子阳 GUO Jingfeng 郭景峰
School of Information Science and Engineering, Yanshan University, Qinhuangdao, Hebei 066004, China 燕山大学信息科学与工程学院,河北秦皇岛066004
国内会议
合肥
中文
829-843
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)