面向主题的网页排序算法研究
PageRank算法是著名的通用搜索引擎的wcb页面排序算法,但对具体主题的信息检索,却存在主题漂移的问题。本文从改进计算模型的传递概率和跳转概率的角度,分析已有的网页排序算法的特点,并给出面向主题的刚页排序算法。新算法考虑了网页内容与主题的相关度、主题信息对I啊页间链接的分类和web页面自身重要度等因素计算的影响。实验证明针对具体领域,新算法在P@10和用户满意度等方面优于PageRank算法。
链接分类 面向主题 信息检索 网页排序 排序算法
闫泼 马军 陈竹敏
山东大学计算机科学与技术学院,济南 250061
国内会议
苏州
中文
521-527
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)