基于多链接分析的主题爬虫设计实现
普通的主题爬虫一般只是对页面的静态链接进行分析,而没有关注到页面中存在着大量的其它链接方式,如动态链接等,从而造成页面的查全和查准率不是很高。本文介绍了一种主题挖掘系统,系统中充分考虑了页面的各种链接,给出系统的详细设计实现。实验表明,其查全和查准率大大提高。
主题爬虫 链接分析 主题挖掘系统 页面检索
刘兵 胡学钢
合肥工业大学计算机与信息学院,安徽合肥 230009
国内会议
南宁
中文
404-408
2009-07-17(万方平台首次上网日期,不代表论文的发表时间)