会议专题

基于分写增强字符向量和LSTM-CRF的朝鲜语自动分写方法

朝鲜语自动分写问题类似于中文分词问题,属于朝鲜语自然语言处理中的基本问题.首先,针对传统的朝鲜语自动分写方法中依赖人工特征的问题,本文提出一种朝鲜语分写增强字符向量训练模型KWSE,用于获取包含语义及分写倾向性信息的字符向量.其次,将朝鲜语分写增强字符向量与LSTM-CRF模型结合完成朝鲜语自动分写任务.实验结果表明本文提出的方法其单词级分写F1值为92.86%,优于其他方法.

朝鲜语 自动分写 分写增强字符向量 神经网络

金国哲 崔荣一

延边大学计算机科学与技术学科,吉林 延吉 133002

国内会议

第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会

南京

中文

1-8

2017-10-13(万方平台首次上网日期,不代表论文的发表时间)