会议专题

一种基于WWW的Ontology属性值自动提取方法

属性值是描述Ontology中类的重要信息,但是当前关于属性值的自动提取的研究并不多。本文提出了一种基于WWW的Ontology属性值自动提取方法。首先在小规模属性值种子集的基础上,包含属性值的句子的选择与属性值提取互动的方法,这种方法利用互联网信息的冗余性,自动抽取并扩充目标属性值集合;然后,为避免人工构造属性值种子集,提出种子集自动生成的方法,并通过将填充后的Ontology信息用于网页正文提取任务,展示了Ontology自动扩充结果的有效性。

文字处理 搜索引擎 语句提取 数理语言学 属性值 自动提取方法

赵庆亮 穗志方

北京大学计算语言研究所 北京 100871 北京大学计算语言研究所 北京大学 100871

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

510-516

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)