会议专题

一种基于主题相关度的网页排序算法

针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法。通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法。理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率。

网页排序算法 主题相关度 链接分析 向量空间模型 网页查询

吴炜 梁昆 李瑞轩 辜希武 卢正鼎

华中科技大学,计算机科学与技术学院,湖北,武汉,430074

国内会议

2008年全国开放式分布与并行计算学术年会

扬州

中文

221-224

2008-10-25(万方平台首次上网日期,不代表论文的发表时间)