Web网页的自动分割与数据区域抽取
用基于HTML标签树的数据块查找方法对Web网页进行区域分割,在此基础上结合网页聚类和跨网页数据区域匹配自动识别一个网页中的动态数据区域。实验结果表明提出的方法能够提高Web网页中动态数据区域识别的召回率和准确率。
Web数据抽取 动态数据区域识别 跨网页分析
孙鹤立 冯博琴 黄健斌
西安交通大学计算机科学与技术系 陕西西安 710049 西安电子科技大学计算机学院 陕西西安 710071
国内会议
西安
中文
370-373
2006-09-01(万方平台首次上网日期,不代表论文的发表时间)