会议专题

基于目录树的网络科技资源采集算法

本文在充分考虑网络科技领域资源分类方式多样化、数据量大等特点的基础上,提出了一种基于目录树的采集算法,算法首先以领域本体知识库提供的本体知识作为评价依据进行有效目录链接的提取和识别,然后通过一种改进的链接分析策略获取有效的节点链接,最后进行采集操作。该算法不但在采集的体系结构上进行了深入研究,同时注重了对最新资源获取速度的优化。实践证明,该算法可以有效的提高采集速率。

科技资源 信息采集 目录树 知识库

柳长安 刘忠强 李国栋

华北电力大学计算机科学与技术学院,北京,102206

国内会议

华北电力大学第五届研究生学术交流年会

北京

中文

1-5

2007-12-24(万方平台首次上网日期,不代表论文的发表时间)