会议专题

基于TF/IDF相似度的标签聚类方法

社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题.标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出一种基于TF/IDF的标签相似度计算方法和基于该相似度的聚类算法;(2)分析了影响标签相似度的条件;(3)通过详实的实验表明,与已有方法相比,新方法具有更好的准确性。

标签聚类 数据挖掘 标签相似度 聚类算法

韩敏 唐常杰 段磊 李川 巩杰

四川大学 计算机学院,四川省 成都市 610065

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

410-415

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)