一种基于主题相关度的网页排序算法
针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法。通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法。理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率。
网页排序算法 主题相关度 链接分析 向量空间模型 网页查询
吴炜 梁昆 李瑞轩 辜希武 卢正鼎
华中科技大学,计算机科学与技术学院,湖北,武汉,430074
国内会议
扬州
中文
221-224
2008-10-25(万方平台首次上网日期,不代表论文的发表时间)