会议专题

基于神经网络的片段级中文命名实体识别

命名实体识别是自然语言处理的一个重要基础任务.传统基于统计学习模型的命名实体识别方法严重依赖特征工程,特征设计需要大量人工参与和专家知识,而且已有的方法通常大多将中文命名实体识别任务看作一个字符序列标注问题,需要依赖局部字符标记区分实体边界.为了减弱系统对人工特征设计的依赖,避免字符序列化标注方法的不足,本文对基于神经网络的片段级中文命名实体识别方法进行探索研究.通过采用深度学习片段神经网络结构,实现特征的自动学习,并通过获取片段信息对片段整体分配标记,同时完成实体边界识别和分类.基于神经网络的片段级中文命名实体识别方法在MSRA数据集上对人名、地名和机构名识别的总体F1值达到了90.44%.

中文命名实体识别 深度学习 神经网络

王蕾 谢云 周俊生 顾彦慧 曲维光

南京师范大学 计算机科学与技术学院,江苏 南京 210046

国内会议

第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会

南京

中文

1-8

2017-10-13(万方平台首次上网日期,不代表论文的发表时间)