会议专题

基于WEB的快速信息抽取技术的研究和实现

面对互联网中浩瀚的信息,固然可以通过一些现成的搜索引擎去搜索,得到的却仍然是一大堆的信息,未必都是想找的,而且,也没有分类.另外,还存在一种”看不见的网”也就是因特网上存在的,被称为”暗藏网”(the hidden web)的网上数据库系统,搜索引擎的”网络爬虫”抓不到这些网页.这就意味着需要一种独立的工具从这些网页中收集数据.本系统实现了准确而高效的找到所需要的信息.

信息抽取 互联网 抽取规划 数据库 数据结构

高英 郭荷清

华南理工大学计算机科学与工程学院(广东省广州市)

国内会议

2003”全国软件与应用学术会议

北京

中文

301-306

2003-11-01(万方平台首次上网日期,不代表论文的发表时间)