字符级的维吾尔语形态协同分析方法
针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题,提出一种基于字符级的维吾尔语形态协同分析方法.该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原,把词素边界、形态标记以及音变信息用一个复合标记描述,采用字符序列的标注方法进行训练.实验结果显示,形态切分、形态标注及音变还原正确率分别达到95.86%,92.39%和99.70%,系统总体正确率达91.84%.
维吾尔语 形态分析 协同分析
吐尔洪·吾司曼 杨雅婷 艾孜孜·吐尔逊 程力
中国科学院新疆理化技术研究所,乌鲁木齐 830011;中国科学院大学,北京 100049;新疆民族语音语言信息处理实验室,乌鲁木齐 830011 和田师范专科学校数学与信息学院,和田 848000
国际会议
2018自然语言处理与中文计算国际会议(NLPCC2018)
呼和浩特
中文
1-9
2018-08-26(万方平台首次上网日期,不代表论文的发表时间)