会议专题

Web结构挖掘在互联网资源搜索引擎中的应用研究

PageRank算法是搜索引擎用于标识网页的等级/重要性的一种方法,但是在实际的应用中,发现它还是存在一定的缺陷.本文提出一种在网页的链接中加入主题相关度的判定(相似矩阵)的方法,可以使网页的PageRank值在具有相似主题的网页上传播,从而减少了主题无关网页对PageRank值的扩散.测试结果表明,改进后的算法可以较好的抑制主题漂移现象,表现出了较好的查全率.

互联网 数据挖掘 PageRank算法 优化设计

李凯 穆筝 孙大鹏

辽宁省通信管理局网络信息安全处 110036

国内会议

辽宁省通信学会2010年通信网络与信息技术年会

沈阳

中文

353-358

2010-06-01(万方平台首次上网日期,不代表论文的发表时间)