会议专题

基于主题相似度指导网络蜘蛛穿越隧道的爬行算法

隧道穿越一直是主题网络蜘蛛爬行研究的难点,本文在分析了网页主题特征和普通隧道技术爬行算法缺点的基础上,提出了使用主题相似度指导网络蜘蛛穿越隧道的爬行算法,并用朴素贝叶斯分类器方法提高主题相似度计算精度。实验表明,本文提出的隧道穿越技术在查准率和查全率方面都比普通隧道技术有很大提高。

主题网络蜘蛛 隧道穿越 主题相似度 贝叶斯分类器

陈小海 周娅

桂林电子科技大学计算机与控制学院,广西,桂林,541004

国内会议

2009年全国理论计算机科学学术年会

哈尔滨

中文

126-128

2009-08-07(万方平台首次上网日期,不代表论文的发表时间)