英汉人名音译方法研究
本文详细比较了两种机器学习方法和两种统计翻译模型在英汉人名音译上的应用效果。首先提出了将英汉人名翻译问题看作序列标注问题的处理思路,并且将两种机器学习方法:最大熵模型和条件随机场模型应用于人名翻译。在使用机器学习算法进行音译时,比较了不同特征集对人名音译的影响,实验表明,字母串特征和标注之间转移特征对提高音译性能有很大帮助。同时,本文还比较了使用不同的语言模型时,基于短语的机器翻译模型和基于N-gram的机器翻译模型在人名音译上的表现。实验表明,好的语言模型能极大地提高音译性能,当使用的训练集相同时,机器学习方法和统计翻译模型取得的音译效果差不多,但是统计翻译方法框架比较灵活,能利用外来的信息,因此更加适合进行英汉人名音译。
机器翻译 英汉人名 语言模型 数理语言学 音译方法
邹波 赵军
中国科学院自动化研究所模式识别国家重点实验室,北京 100080
国内会议
太原
中文
336-343
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)