汉英双向时间和数字命名实体的识别与翻译系统
时间和数字命名实体的识别与翻译是统计机器翻译中语料预处理任务的一个重要步骤,对后续的模型训练和系统性能有重要的影响.本文在考虑汉英两种语言中时间和数字命名实体构成规律的基础上,将其进行了类别划分并分别制定了相应的识别和翻译规则,最终实现了一个基于规则方法的时间和数字命名实体识别翻译工具。经实验测试,该工具具备较高的识别和翻译准确率,提高了统计机器翻译系统的性能。
机器翻译 语料预处理 时间命名实体 数字命名实体 识别技术 翻译原则
翟飞飞 夏睿 周玉 宗成庆
中国科学院自动化所 模式识别国家重点实验室 北京 100190
国内会议
南京
中文
172-179
2009-10-16(万方平台首次上网日期,不代表论文的发表时间)