会议专题

基于短语相似度的统计机器翻译系统设计

针对传统基于短语的机器翻译中采用的精确匹配策略导致翻译出的短语存在稀疏性的问题,引入相似度解决翻译后短语的稀疏性问题.对此,文章首先结合机器翻译的原理进行分析,并指出传统短语翻译存在的问题;其次,提出短语相似度统计模型,在对训练的语料库进行训练时,对其中没有出现过的短语,通过计算短语之间的相似度的方式,并改变传统的精确匹配方式,而采用模糊匹配策略,从短语表中查找相似度较高的实例短语,最后这些实例短语,构造汉英翻译句子;最后,对上述的算法进行了实验验证.结果表明,极大的提高了翻译的质量.

机器翻译 短语相似度 统计模型 稀疏性

张睿

西安翻译学院 陕西西安,710105

国内会议

2017年西南三省一市(贵州、重庆、四川、云南)自动化与仪器仪表学术年会

重庆

中文

66-67,70

2017-10-01(万方平台首次上网日期,不代表论文的发表时间)