会议专题

搜索引擎中基于无向图的聚类算法研究

提出了一种搜索引擎中基于无向图的聚类算法。算法先根据返回网页的相关信息计算网页间的相似性,再将检索结果及其相似性关系映射为无向图,然后从图中随机选取几个点作为初时质心,依次计算剩余点与质心的相似度,根据其与阀值的关系决定是否将其加入某个簇,直至加入全部的点,从而将返回结果组织为有限的几类,提高用户检索信息的效率。理论分析表明,提出的聚类算法在一定程度上解决了文档多义性问题及孤立点问题。 实验结果也表明,所提的聚类算法具有较好的效果,能有效聚类返回结果。

搜索引擎 聚类 无向图 相似度

李伟健 王实 刘湘草 白家鸣 晏文菲

湖南大学 软件学院,长沙 410082

国内会议

第五届中国软件工程大会

北京

中文

38-41

2008-11-15(万方平台首次上网日期,不代表论文的发表时间)