会议专题

基于SVM方法的中文实体关系抽取

实体关系抽取是很多自然语言处理任务的重要基础。本文针对中文中实体关系的特点,设计了一系列的特征。包括词、词性标注、实体和出现信息、包含关系和知网提供的概念信息等,以构成实体间关系的上下文特征向量并使用SVM方法进行了中文实体关系抽取。以ACE2004的训练语料作为实验数据,得到了较好的识别性能。同时根据分级实验的结果,考察了各种特征集对识别性能的影响,得到下一步研究的方向。

信息抽取 实体关系抽取 特征选择 知网信息 自然语言处理 词性标注

徐芬 王挺 陈火旺

国防科学技术大学计算机学院,湖南 长沙,410073

国内会议

第九届全国计算语言学学术会议

大连

中文

497-502

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)