会议专题

一种基于网页质量的PageRank算法改进

随着Web技术的发展和Web上越来越多的各种信息,如何提供高质量、相关的查询结果成为当前Web搜索引擎的一个巨大挑战.PageRank和HITS是两个最重要的基于链接的排序算法并在商业搜索引擎中使用.然而,在PageRank算法中,每个网页的PR值被平均地分配到它所指向的所有网页,网页之间的质量差异被完全忽略.这样的算法很容易被当前的Web SPAM攻击。基于这样的认识,提出了一个关于PageRank算法的改进,称为Page Quality BasedPageRank(QPR)算法.QPR算法动态地评估每个网页的质量,并根据网页的质量对每个网页的PR值做相应公平的分配.在多个不同特性的数据集上进行了全面的实验,实验结果显示,提出的QPR算法能大大提高查询结果的排序,并能有效减轻SPAM网页对查询结果的影响.

Web技术 PageRank算法 网页质量 QPR算法

陈小飞 王轶彤 冯小军

复旦大学计算机科学技术学院 上海 200433

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

381-387

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)