会议专题

Web搜索的网页更新检测算法研究

随着网络上信息的快速增长,搜索引擎的数据更新技术成为获取信息的一种有效方法。本文描述了搜索引擎的基本技术,讨论了搜索引擎在网页更新时的检测算法,提出了通过ICMPU算法来检测页面是否有更新。该算法通过分析网页HTML标签提取的网页中心内容是否改变、网页图像是否改变来确定网页是否需要重新下载。

信息检索 搜索引擎 网络爬虫 页面更新

周艳 吴跃 鲁珂 龚海刚

电子科技大学计算机科学与工程学院 成都 610054

国内会议

2009年西南地区网络与信息系统学术年会

成都

中文

229-230,252

2009-08-12(万方平台首次上网日期,不代表论文的发表时间)