会议专题

基于Web信息的实体关系抽取

针对中文实体关系抽取的难点问题,本文在原有的基于Bootstrapping思想进行实体关系抽取的方法上进行了改进.一方面提出了使用《同义词词林》作为计算词语语义相似度的工具,从而获取更多的与种子词相似语义关系的特征词;另一方面通过自学习种子集合不断扩展,并利用最终得到的种子信息获取正例.然后使用查询扩展技术从这些正例中生成查询,通过这些查询可以从大量的文本数据库中检索出潜在的文档,减少了抽取的时间.实验结果表明,该方法能够有效地抽取出实体关系,并且有较高的召回率和准确率。

Bootstrapping 同义词词林 语义相似度 查询扩展 关系抽取 Web信息

王立红 李庆忠 董永权

山东大学计算机科学与技术学院 济南 250101

国内会议

全国Web信息系统及其应用学术会议、全国语义Web与本体论学术研讨会暨全国电子政务技术与应用学术研讨会

西安

中文

21-23

2008-04-12(万方平台首次上网日期,不代表论文的发表时间)