Web结构挖掘在互联网资源搜索引擎中的应用研究
PageRank算法是搜索引擎用于标识网页的等级/重要性的一种方法,但是在实际的应用中,发现它还是存在一定的缺陷.本文提出一种在网页的链接中加入主题相关度的判定(相似矩阵)的方法,可以使网页的PageRank值在具有相似主题的网页上传播,从而减少了主题无关网页对PageRank值的扩散.测试结果表明,改进后的算法可以较好的抑制主题漂移现象,表现出了较好的查全率.
互联网 数据挖掘 PageRank算法 优化设计
李凯 穆筝 孙大鹏
辽宁省通信管理局网络信息安全处 110036
国内会议
沈阳
中文
353-358
2010-06-01(万方平台首次上网日期,不代表论文的发表时间)