基于用户兴趣链接的Web文档聚类
WWW缓存中的文档信息揭示出用户的最近的访问兴趣,本文从Web使用挖掘的角度,分析用户的浏览Wed页面的行为,提出一种新颖的Web文档聚类算法。该算法充分利用Web文档的超链接的语义信息和Wed内容及结构信息,根据用户的访问链接对WWW缓存中的Web文档进行聚类,挖掘出用户的兴趣聚类,实验表明,与K均值和层次化聚类相比,本文方法可以快速有效的对WWW缓存中的文档聚类。
Web文档 文档聚类 访问兴趣 文档挖掘 用户兴趣
崔自峰 徐宝文
东南大学计算机学院 江苏南京 211189
国内会议
2007”信息与通信工程、电子科学与技术、计算机科学与技术、机械工程全国博士生学术论坛
西安
中文
467-473
2007-09-15(万方平台首次上网日期,不代表论文的发表时间)