一种高效的网页分类和数据对象识别集成方法
Web已经成为一个日益重要的数据源,越来越多的Web应用需要从特定领域的数据密集型网页上获取结构化的数据对象。网页中的数据对象识别问题成为今年来的研究热点,但是其前端的数据密集型相关网页的自动发现仍然是一个亟待解决的问题。同时,孤立地解决这两个问题会带来不必要的重覆工作,效率较低。本文提出了一种新颖、高效的网页分类与数据对象识别的集成方法。首先,本文提出了一种简单有效的网页特征表示方法一带有结构信息的领域
垂直搜索 数据对象识别 上下文信息 网页分类
林玲 周立柱
清华大学计算机科学与技术系,北京,100084
国内会议
苏州
中文
364-374
2007-10-18(万方平台首次上网日期,不代表论文的发表时间)