一种基于WWW的Ontology属性值自动提取方法
属性值是描述Ontology中类的重要信息,但是当前关于属性值的自动提取的研究并不多。本文提出了一种基于WWW的Ontology属性值自动提取方法。首先在小规模属性值种子集的基础上,包含属性值的句子的选择与属性值提取互动的方法,这种方法利用互联网信息的冗余性,自动抽取并扩充目标属性值集合;然后,为避免人工构造属性值种子集,提出种子集自动生成的方法,并通过将填充后的Ontology信息用于网页正文提取任务,展示了Ontology自动扩充结果的有效性。
文字处理 搜索引擎 语句提取 数理语言学 属性值 自动提取方法
赵庆亮 穗志方
北京大学计算语言研究所 北京 100871 北京大学计算语言研究所 北京大学 100871
国内会议
太原
中文
510-516
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)