Web搜索的网页更新检测算法研究
随着网络上信息的快速增长,搜索引擎的数据更新技术成为获取信息的一种有效方法。本文描述了搜索引擎的基本技术,讨论了搜索引擎在网页更新时的检测算法,提出了通过ICMPU算法来检测页面是否有更新。该算法通过分析网页HTML标签提取的网页中心内容是否改变、网页图像是否改变来确定网页是否需要重新下载。
信息检索 搜索引擎 网络爬虫 页面更新
周艳 吴跃 鲁珂 龚海刚
电子科技大学计算机科学与工程学院 成都 610054
国内会议
成都
中文
229-230,252
2009-08-12(万方平台首次上网日期,不代表论文的发表时间)