会议专题

XML模式聚类中的一种多策略模式相似度算法

对Internet上越来越多的XML文档的模式进行聚类近年来已成为一个研究热点.相似度计算是聚类操作的基础.提出了一种基于模式匹配的多策略XML模式相似度计算方法:采用了一种基于词语间语义距离的方法来计算其语义相似度;提出了一种基于相似度传播的结构匹配算法,有效地考虑了相邻相似节点间的相互影响.实验结果表明,这种方法在处理模式匹配任务时能达到较高的精度和效率.在此基础上可方便地对DTD模式进行聚类操作.

XML文档 模式聚类 相似度算法 策略模式 模式匹配

程伟 孙玉芳

中国科学院软件研究所,北京,100080

国内会议

2005第一届中国分类技术与应用研讨会(CSCA)

北京

中文

107-111

2005-09-23(万方平台首次上网日期,不代表论文的发表时间)