会议专题

CRF与规则相结合的维吾尔文地名识别研究

通过维吾尔文地名的分析研究,提出了一种基于条件随机场和规则的维吾尔文地名识别方法.根据维吾尔文地名黏着性、音译等特点,针对维吾尔文地名识别任务,在词汇和词性特征基础之上,引入音节、词向量获取的相似单词、常用地名词典、地名特征词、地名词缀等特征进行实验,结果表明这些特征对识别性能有较大的影响.通过对错误识别结果分析,提出了基于规则的后处理,进一步提高了识别性能,准确率达到94.68%,召回率达到89.52%,F值达到92.03%.

命名实体 维吾尔文 地名识别 条件随机场 词向量

买合木提·买买提 卡哈尔江·阿比的热西提 艾山·吾买尔 吐尔根·依布拉音 王路路

新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046;新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046

国内会议

第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会

南京

中文

1-10

2017-10-13(万方平台首次上网日期,不代表论文的发表时间)