会议专题

基于独立分量的XML文档聚类方法

XML文档聚类可有效地压缩搜索空间,从而加速查询.本文提出一种新的基于独立分量的文档聚类方法,该方法能挖掘文档矩阵中潜在的、更加划分能力的属性,而且同时具有降维作用以减小计算量.首先利用层次路径序列进行特征提取,将文档矩阵映射到向量空间中,然后在独立分量所张成的新空间中进行聚类分析,实验结果表明该方法在准确性和扩展性上都明显优于传统的聚类方法.据我们所知,本文是最早将独立分量分析应用于XML文档聚类的.

独立成分 文档聚类 特征提取 层次路径序列

王桐 刘大昕

哈尔滨工程大学计算机科学与技术学院,哈尔滨,150001

国内会议

全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会

南京

中文

81-83

2006-10-01(万方平台首次上网日期,不代表论文的发表时间)