汉维时间数字和量词的识别与翻译研究

统计机器翻译对时间、数字、量词的泛化能力较弱,为了提高汉维机器翻译系统对时间、数字和量词短语的翻译性能,本文利用双语语料库挖掘并提取汉语时间、数字、量词表达与翻译模式,实现了基于模板的时间、数字、无歧义量词翻译方法及基于上下文的有歧义量词翻译方法.时间、数字、无歧义量词、有歧义量词的翻译F值达到了93.23%、90.15%、96.55%、87.58%,实验证明,本文提出的方法具有简单高效的优点.
汉语 维吾尔语 时间 数字 量词 识别方法 机器翻译
阿依古丽·哈力克 艾山·吾买尔 吐尔根·伊布拉音 卡哈尔江·阿比的热西提 买合木提·买买提
新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046;新疆多语种信息技术重点实验室,新疆 乌鲁木齐 830046
国内会议
第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)
烟台
中文
1-12
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)