会议专题

基于分层的以目标结点为导向的XML枝匹配算法

目前,已提出的XML枝匹配算法返回的结果都是整个匹配枝,另外,当XML文档中存在递归结构时,一个目标数据元素可能存在于多个匹配的枝中。然而,通常情况下,用户只需要得到目标数据元素的相关信息,因而,从这些匹配枝中提取出的目标数据元素会存在重复现象,需要后续的去除冗余操作。针对这一问题,本文对已提出的一些代表性的XML枝匹配算法的返回无冗余的目标元素的时间做了比较。另外,基于分层思想,提出了一个新的枝匹配算法。该算法对查询枝根结点对应的数据元素的每个层次自底向上执行一次查询,一层处理之后去除匹配的目标元素,从而避免了后续的去除冗余操作。通过分层求解,减小了去除冗余的代价,并且保证结果按照最邻近的祖先聚簇返回。

XML文档 枝匹配算法 信息检索 去除冗余操作

姚美玲 刘贵全

中国科学技术大学,合肥,230027

国内会议

第五届全国信息检索学术会议CCIR2009

上海

中文

107-116

2009-11-14(万方平台首次上网日期,不代表论文的发表时间)