基于分解转移矩阵的PageRank迭代计算方法
提出了一种基于分解转移矩阵的PageRank的迭代计算方法。该方法对PageRank理论模型进一步推导,把其Markov状态转移矩阵进行了分解,从而降低存储开销和计算复杂度,减少I/O需求,使得PageRank计算的工程化实现更为简单。实验表明1700多万的网页2.8亿条链接,可以在30秒内完成一次迭代,内存需求峰值585MB,可以满足工程化应用的需求。
搜索引擎 状态转移矩阵 矩阵分解 迭代计算
刘松彬 都云程 施水才
北京信息科技大学中文信息处理研究中心,北京 100101
国内会议
大连
中文
446-452
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)