基于用户兴趣链接的Web文档聚类

摘要：

WWW缓存中的文档信息揭示出用户的最近的访问兴趣,本文从Web使用挖掘的角度,分析用户的浏览Wed页面的行为,提出一种新颖的Web文档聚类算法。该算法充分利用Web文档的超链接的语义信息和Wed内容及结构信息,根据用户的访问链接对WWW缓存中的Web文档进行聚类,挖掘出用户的兴趣聚类,实验表明,与K均值和层次化聚类相比,本文方法可以快速有效的对WWW缓存中的文档聚类。

关键词： Web文档文档聚类访问兴趣文档挖掘用户兴趣

作者: 崔自峰徐宝文

作者单位: 东南大学计算机学院江苏南京 211189

会议类型: 国内会议

会议名称: 2007”信息与通信工程、电子科学与技术、计算机科学与技术、机械工程全国博士生学术论坛

会议地点: 西安

会议语种:中文

页码: 467-473

在线出版日期: 2007-09-15（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于用户兴趣链接的Web文档聚类