基于SVM方法的中文实体关系抽取
实体关系抽取是很多自然语言处理任务的重要基础。本文针对中文中实体关系的特点,设计了一系列的特征。包括词、词性标注、实体和出现信息、包含关系和知网提供的概念信息等,以构成实体间关系的上下文特征向量并使用SVM方法进行了中文实体关系抽取。以ACE2004的训练语料作为实验数据,得到了较好的识别性能。同时根据分级实验的结果,考察了各种特征集对识别性能的影响,得到下一步研究的方向。
信息抽取 实体关系抽取 特征选择 知网信息 自然语言处理 词性标注
徐芬 王挺 陈火旺
国防科学技术大学计算机学院,湖南 长沙,410073
国内会议
大连
中文
497-502
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)