XML模式聚类中的一种多策略模式相似度算法
对Internet上越来越多的XML文档的模式进行聚类近年来已成为一个研究热点.相似度计算是聚类操作的基础.提出了一种基于模式匹配的多策略XML模式相似度计算方法:采用了一种基于词语间语义距离的方法来计算其语义相似度;提出了一种基于相似度传播的结构匹配算法,有效地考虑了相邻相似节点间的相互影响.实验结果表明,这种方法在处理模式匹配任务时能达到较高的精度和效率.在此基础上可方便地对DTD模式进行聚类操作.
XML文档 模式聚类 相似度算法 策略模式 模式匹配
程伟 孙玉芳
中国科学院软件研究所,北京,100080
国内会议
北京
中文
107-111
2005-09-23(万方平台首次上网日期,不代表论文的发表时间)