基于最长公共访问路径的Web日志聚类算法的改进
目前使用Web日志进行用户聚类的算法,大部分都没有考虑用户访问路径中页面的有序性.针对上述问题,本文在最长公共访问路径基础上,提出了一种用户访问路径相似度的计算方法,并结合k-means算法进行用户访问路径聚类,成功地辨别出某些其它路径聚类算法难以区分的用户访问模式的不同.试验结果表明该算法更准确地反映了用户访问路径的相似程度,能够获得较高的聚类质量.
访问路径 Web日志 聚类算法 相似度 k-means算法
王翠茹 李自强
华北电力大学计算机科学与技术学院,保定,071003
国内会议
沈阳
中文
361-363
2005-09-01(万方平台首次上网日期,不代表论文的发表时间)