会议专题

一种新的XML近似查询及排序方法

对海量的、异构XML文档进行检索时,现有的查询语言如XPath,XQuery已无法胜任,需要将数据挖掘和信息检索两方面相结合进行近似查询.提出一种新的XML文档近似查询方法,首先根据提出的层次路径模型提取文档结构特征,进行向量空间映射.然后通过奇异值分解进行矩阵变换,在去除相关冗余的同时有效地降低了空间维数.目标文档的匹配在变换后的检索空间中进行,同时对返回的查询结果进行相似性排序.采用DBLP数据集进行测试,实验获得良好的查询及排序结果。

XML 近似查询 LSA 排序方法 文档检索 数据挖掘

刘大昕 王桐

哈尔滨工程大学,计算机科学与技术学院,黑龙江,哈尔滨,150001

国内会议

第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)

哈尔滨

中文

407-410

2006-08-05(万方平台首次上网日期,不代表论文的发表时间)