基于单层扁平结构的XML网页信息抽取系统的研究与初步实现
从Web网页中自动抽取所需要的信息内容,是互联网信息智能搜索的一个重要研究课题。为有效解决网页信息的自动抽取问题,文章将JAVA和XML技术相结合,构建了一个基于单层扁平结构的网页信息抽取系统,只要存贮信息的标记的内部结构不发生变化,该系统基本可以实现对网页信息的自动抽取。
网页信息 抽取系统 单层扁平结构
火善栋 朱南丽 黄青松
昆明理工大学 信息工程与自动化学院,云南 昆明 650051
国内会议
昆明
中文
143-147
2005-10-01(万方平台首次上网日期,不代表论文的发表时间)