会议专题

基于多链接分析的主题爬虫设计实现

普通的主题爬虫一般只是对页面的静态链接进行分析,而没有关注到页面中存在着大量的其它链接方式,如动态链接等,从而造成页面的查全和查准率不是很高。本文介绍了一种主题挖掘系统,系统中充分考虑了页面的各种链接,给出系统的详细设计实现。实验表明,其查全和查准率大大提高。

主题爬虫 链接分析 主题挖掘系统 页面检索

刘兵 胡学钢

合肥工业大学计算机与信息学院,安徽合肥 230009

国内会议

全国第20届计算机技术与应用(CACIS)学术会议

南宁

中文

404-408

2009-07-17(万方平台首次上网日期,不代表论文的发表时间)