基于TF/IDF相似度的标签聚类方法

摘要：

社会标签系统是Web2.0中提出的新概念，旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题．标签相似度的计算是标签聚类的关键技术。主要工作包括：(1)提出一种基于TF/IDF的标签相似度计算方法和基于该相似度的聚类算法；(2)分析了影响标签相似度的条件；(3)通过详实的实验表明，与已有方法相比，新方法具有更好的准确性。

关键词：标签聚类数据挖掘标签相似度聚类算法

作者: 韩敏唐常杰段磊李川巩杰

作者单位: 四川大学计算机学院,四川省成都市 610065

会议类型: 国内会议

会议名称: NDBC2009第26届中国数据库学术会议

会议地点: 南昌

会议语种:中文

页码: 410-415

在线出版日期: 2009-10-15（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于TF/IDF相似度的标签聚类方法