基于主题的Web信息采集系统研究
构建了基于主题的Web信息采集系统模型,描述了采用上下文图的基于主题的Web信息采集方法,所采用的上下文图能抓取有价值页面的典型的链接层次,也能模拟出相关页面的文档的内容,本算法显示出比普通主题采集方法更高的采集效率。
网页信息 信息采集系统 采集效率
万小容 火善栋 黄青松
昆明理工大学 信息工程与自动化学院,云南 昆明 650051
国内会议
昆明
中文
148-151
2005-10-01(万方平台首次上网日期,不代表论文的发表时间)
网页信息 信息采集系统 采集效率
万小容 火善栋 黄青松
昆明理工大学 信息工程与自动化学院,云南 昆明 650051
国内会议
昆明
中文
148-151
2005-10-01(万方平台首次上网日期,不代表论文的发表时间)