会议专题

基于用户兴趣链接的Web文档聚类

WWW缓存中的文档信息揭示出用户的最近的访问兴趣,本文从Web使用挖掘的角度,分析用户的浏览Wed页面的行为,提出一种新颖的Web文档聚类算法。该算法充分利用Web文档的超链接的语义信息和Wed内容及结构信息,根据用户的访问链接对WWW缓存中的Web文档进行聚类,挖掘出用户的兴趣聚类,实验表明,与K均值和层次化聚类相比,本文方法可以快速有效的对WWW缓存中的文档聚类。

Web文档 文档聚类 访问兴趣 文档挖掘 用户兴趣

崔自峰 徐宝文

东南大学计算机学院 江苏南京 211189

国内会议

2007”信息与通信工程、电子科学与技术、计算机科学与技术、机械工程全国博士生学术论坛

西安

中文

467-473

2007-09-15(万方平台首次上网日期,不代表论文的发表时间)