会议专题

结合属性分布特征的模式匹配算法

本文提出了一种结合属性分布特征的Web模式匹配算法,属性分布特征包括属性对互斥特征和属性对共现特征。属性对互斥特征由属性对的互斥性和出现次数计算得出,这个特征隐含了属性对的语义相似程度。为了充分利用传统的属性名、属性值相似性特征,本文通过机器学习方法结合属性对互斥特征与相似性特征进行属性匹配。并以潜在的匹配属性对为基础,引入有约束的属性聚类方法进行Web模式匹配,聚类方法的约束条件来自属性对共现特征。实验结果表明,相对于仅使用相似性特征的方法,结合属性分布特征的Web模式匹配算法取得了更好的结果,解决了单独使用属性名相似性能处理的属性较少,而属性值相似性需要针对特定领域优化的问题。

属性对互斥 属性对共现 Web模式匹配 约束聚类

王宇 方滨兴 吴博 宋林海 郭岩

中国科学院计算技术研究所智能信息与智能安全中心,北京,100190 中国科学院研究生院,北京,100190 中国科学院计算技术研究所智能信息与智能安全中心,北京,100190

国内会议

第五届全国信息检索学术会议CCIR2009

上海

中文

88-98

2009-11-14(万方平台首次上网日期,不代表论文的发表时间)