会议专题

基于分解转移矩阵的PageRank迭代计算方法

提出了一种基于分解转移矩阵的PageRank的迭代计算方法。该方法对PageRank理论模型进一步推导,把其Markov状态转移矩阵进行了分解,从而降低存储开销和计算复杂度,减少I/O需求,使得PageRank计算的工程化实现更为简单。实验表明1700多万的网页2.8亿条链接,可以在30秒内完成一次迭代,内存需求峰值585MB,可以满足工程化应用的需求。

搜索引擎 状态转移矩阵 矩阵分解 迭代计算

刘松彬 都云程 施水才

北京信息科技大学中文信息处理研究中心,北京 100101

国内会议

第九届全国计算语言学学术会议

大连

中文

446-452

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)