会议专题

一种杂交算法在Web文档聚类中的研究

本文针对K均值(K-means)聚类算法在Web文档聚类全局优化中的不足,提出了基于粒子群的K均值(PSO-KM)聚类算法.粒子群优化算法(PSO)是一种基于群智能的演化计算技术,有很强的全局搜索能力.文中采用F-measure和熵作为评价聚类质量的标准,把网上搜索到的真实Web文档作为实验数据对这种杂交算法进行了仿真试验.通过与K-means算法及基于基因算法的K均值(GA-KM)聚类算法的结果比较,可以看出PSO-KM聚类算法对Web文档的聚类质量优于其它两种算法,同时PSO-KM聚类算法的运算速度优于GA-KM算法.

粒子群 K均值算法 全局优化 Web文档聚类

肖立中 邵志清 吴庆涛 刘刚

华东理工大学信息科学与工程学院,上海,200237 河南科技大学电子信息工程学院,洛阳,471003

国内会议

全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会

南京

中文

77-80

2006-10-01(万方平台首次上网日期,不代表论文的发表时间)