会议专题

面向中文专利SAO结构抽取的文本特征比较研究

针对中文专利文本中SAO结构实体关系抽取问题,使用支持向量机的机器学习方法进行关系抽取实验,分别对基本词法信息、实体间距离信息、最短路径闭包树句法信息以及词向量信息等特征的有效性进行验证分析.实验结果表明,基本的词法信息能够明显提高关系抽取性能,而句法信息没有显著提高关系抽取效果.此外,也验证了词向量在SAO结构关系抽取中的可行性.

中文专利文本 SAO结构 实体关系 特征提取

饶齐 王裴岩 张桂平

沈阳航空航天大学知识工程研究中心,沈阳110136

国内会议

第三届CCF国际自然语言处理与中文计算会议

深圳

中文

349-356

2014-12-05(万方平台首次上网日期,不代表论文的发表时间)