基于主题相似度指导网络蜘蛛穿越隧道的爬行算法
隧道穿越一直是主题网络蜘蛛爬行研究的难点,本文在分析了网页主题特征和普通隧道技术爬行算法缺点的基础上,提出了使用主题相似度指导网络蜘蛛穿越隧道的爬行算法,并用朴素贝叶斯分类器方法提高主题相似度计算精度。实验表明,本文提出的隧道穿越技术在查准率和查全率方面都比普通隧道技术有很大提高。
主题网络蜘蛛 隧道穿越 主题相似度 贝叶斯分类器
陈小海 周娅
桂林电子科技大学计算机与控制学院,广西,桂林,541004
国内会议
哈尔滨
中文
126-128
2009-08-07(万方平台首次上网日期,不代表论文的发表时间)