会议专题

基于谓词驱动模板的汉日机器翻译方法

本篇文章通过对汉语中谓词以及结构辅助词的分析研究提出了一种基于谓词驱动模板的机器翻译方法.谓词驱动模板方法将谓词以及结构辅助词固化在模板中,实现句子级的结构精确匹配,从而在模板库中找到最适合的翻译模板进行翻译.根据汉语中谓词的分布情况,初步考虑在动词作为谓词时,对谓词驱动模板的获取、检索、匹配对齐以及翻译的方法进行了详细讨论.最后使用由5万句规模的汉日体育新闻语科库生成的谓词驱动模板库对受限小样本开放语料进行翻译测试并获得了较好结果.对于相关的体育新闻语料的测试准确率达到83.3%,而对于弱相关的旅游、天气等新闻语科的测试达到63.2%,平均准确率达到73.0%.

谓词驱动模板 结构辅助词 结构精确匹配

陈晴 姚天顺 张俐 姜涛 石磊 李彦丹 肖桐

东北大学自然语言处理实验室,沈阳,辽宁

国内会议

中国中文信息学会二十五周年学术会议

北京

中文

439-446

2006-11-21(万方平台首次上网日期,不代表论文的发表时间)