基于Web信息的实体关系抽取

摘要：

针对中文实体关系抽取的难点问题,本文在原有的基于Bootstrapping思想进行实体关系抽取的方法上进行了改进.一方面提出了使用《同义词词林》作为计算词语语义相似度的工具,从而获取更多的与种子词相似语义关系的特征词;另一方面通过自学习种子集合不断扩展,并利用最终得到的种子信息获取正例.然后使用查询扩展技术从这些正例中生成查询,通过这些查询可以从大量的文本数据库中检索出潜在的文档,减少了抽取的时间.实验结果表明,该方法能够有效地抽取出实体关系,并且有较高的召回率和准确率。

关键词： Bootstrapping 同义词词林语义相似度查询扩展关系抽取 Web信息

作者: 王立红李庆忠董永权

作者单位: 山东大学计算机科学与技术学院济南 250101

会议类型: 国内会议

会议名称: 全国Web信息系统及其应用学术会议、全国语义Web与本体论学术研讨会暨全国电子政务技术与应用学术研讨会

会议地点: 西安

会议语种:中文

页码: 21-23

在线出版日期: 2008-04-12（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于Web信息的实体关系抽取