会议专题

基于PageRank和锚文本的网页排序研究

传统链接分析主要利用基于随机冲浪模型的PageRank技术,将网页入度作为评估网页重要性的一个指标.本文在利用传统链接分析成果的基础上,首先获得网页的PageRank值,对其进行初步排序,再利用锚文本和查询词的相似度进行二次排序.由于在某些情况下,来源于低权威性网页的锚文本更能合理描述目标网页,因此本文还对此类目标网页的排名加以修正.通过实验表明,这种方法实现了对网页较为公平合理的排序.

链接分析 锚文本 PageRank 网页排序 随机冲浪模型

刘菁菁 林鸿飞 杨志豪

大连理工大学计算机科学与工程系,大连,116024

国内会议

第三届学术计算语言学研讨会

沈阳

中文

466-469

2006-08-15(万方平台首次上网日期,不代表论文的发表时间)