基于本体实例信息的深度网表单属性自动抽取
Deep Web是隐藏在Surface Web之后的信息提供者,而且在Deep Web之中还隐藏着更大量的信息.目前,对Deep Web中的信息进行有效的获取的可行方法是通过Deep Web提供的查询接口对其进行访问.自动抽取查询接口中的属性并生成正确的查询条件是提升访问Deep Web能力的有效方法.查询接口中属性之间存在着不同的语义约束关系,如互斥和共存.为了生成有效的查询条件,必须发现并协调关键属性间的语义关系.为了解决些问题,提出一个基于本体技术并充分利用实例信息的表单属性自动抽取方法,在这一方法中使用WordNet来丰富抽取出的关键属性并发现表单中属性间的语义关系.在属性抽取过程中,每个属性被拓展生成一个备选属性集并且以树型数据结构存储,而且备选属性树可以有效的描述属性间的语义关系.在现实领域中的试验证明,这一框架结构可以自动的抽取Deep Web表单属性并有效的生成查询条件.
查询接口 深度网表单属性 自动抽取 本体实例 Web表单
梁浩 左万利 任斐 赫枫龄
吉林大学,计算机科学与技术学院,吉林,长春,130012;长春税务学院,信息系,吉林,长春,130117 吉林大学,计算机科学与技术学院,吉林,长春,130012;符号计算与知识工程教育部重点实验室,吉林,长春,130012 吉林大学,计算机科学与技术学院,吉林,长春,130012
国内会议
徐州
中文
883-886
2009-05-01(万方平台首次上网日期,不代表论文的发表时间)