会议专题

基于主题的Web信息采集系统研究

  构建了基于主题的Web信息采集系统模型,描述了采用上下文图的基于主题的Web信息采集方法,所采用的上下文图能抓取有价值页面的典型的链接层次,也能模拟出相关页面的文档的内容,本算法显示出比普通主题采集方法更高的采集效率。

网页信息 信息采集系统 采集效率

万小容 火善栋 黄青松

昆明理工大学 信息工程与自动化学院,云南 昆明 650051

国内会议

2005年昆明理工大学研究生学术交流年会

昆明

中文

148-151

2005-10-01(万方平台首次上网日期,不代表论文的发表时间)