会议专题

汉英机器翻译扩充词典的建造

本文首先介绍了我们在”面向新闻领域的汉英机器翻译系统”中语言资源建设的总体框架,然后着重介绍了其中扩充词典的建设方法.扩充词典是相对于核心词典而言的,特点是词汇量大,每个词的信息相对较少.扩充词典的建设包括以下几个阶段:收集;格式整理;词条拆分;词性标记归一化;词性标记补齐;词条合并.实验结果表明,采用这种方法,利用较少的人工,就可以得到规模很大、并初步可用的双语机器翻译词典,并且这部词典可大大减少翻译中未定义词的数量,提高翻译的质量.

机器翻译 双语词典获取 语言资源建设 汉英双语语料库

刘群 张彤

北京大学计算机语言学研究所 中国科学院计算技术研究所

国内会议

2002年全国机器翻译研讨会

北京

中文

25-33

2002-11-01(万方平台首次上网日期,不代表论文的发表时间)