会议专题

垂直搜索引擎主题爬虫搜索算法的一种改进算法

随着互联网和WWW的迅速发展,互联网上的资源日趋丰富,为了帮助人们在浩瀚的网上信息中得到对自己有用的信息,基于互联网的各类信息检索服务应运而生并迅速发展.通用搜索引擎的功能已经十分强大,一般情况下可以满足用户的需求.垂直搜索引擎的出现,及时的解决了用户想查询具体专业或者行业的信息的问题,但是主题爬虫的爬行策略却影响了搜索引擎的准确度跟效率.本文通过分析主题爬虫的爬行策略,并结合基于文本内容的启发式策略和基于Web超链接评价的策略,给出了自己改进的一个搜索策略算法,并通过实验对比,改进的策略是有效可行的.

垂直搜索引擎 搜索算法 主题爬虫 信息检索 爬行策略,

左晓骏 张开拓

贵州大学,贵阳,中国,550025 河北华电石家庄热电有限公司,石家庄,中国,050000

国内会议

2010年亚太青年通信与技术学术会议

昆明

中文

509-513

2010-07-01(万方平台首次上网日期,不代表论文的发表时间)