会议专题

Web网页的自动分割与数据区域抽取

用基于HTML标签树的数据块查找方法对Web网页进行区域分割,在此基础上结合网页聚类和跨网页数据区域匹配自动识别一个网页中的动态数据区域。实验结果表明提出的方法能够提高Web网页中动态数据区域识别的召回率和准确率。

Web数据抽取 动态数据区域识别 跨网页分析

孙鹤立 冯博琴 黄健斌

西安交通大学计算机科学与技术系 陕西西安 710049 西安电子科技大学计算机学院 陕西西安 710071

国内会议

中国电子学会第十二届全国青年学术年会

西安

中文

370-373

2006-09-01(万方平台首次上网日期,不代表论文的发表时间)