会议专题

使用三元组可比语料库改进和发展机器翻译系统

目前,国内外基于语料库的翻译研究主要集中在翻译共性、翻译规范、译者风格和翻译培训等 涉及翻译理论和翻译实践方面的研究;本文提出的基于三元组可比语料库的自动语言剖析技术扩大 了该研究领域的内涵,使其包括面向自然语言处理的应用研究。文章中,从工程可实现性考虑,创新性地提出了建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信息检索等自然语言处理应用的目标。

corpus-based translation studies (CBTS) 3-tuple comparable corpora automatic languageprofiling n-grams

肖健 袁琦 宋金平

中国电子信息产业发展研究院, 北京 100048

国内会议

第十四届全国科技翻译研讨会

广州

中文

352-362

2011-11-01(万方平台首次上网日期,不代表论文的发表时间)