基于音译和网络的命名实体翻译方法研究

摘要：

传统的音译方法采用建立音译模型解决音译命名实体的翻译问题，但是该方法不能解决不符合音译规律或部分符合音译规律的命名实体翻译问题。为此，本文提出一种利用音译结果作为扩展，从网络中挖掘命名实体翻译的方法。具体而言，采用加权频度算法从音译结果中抽取单字作为扩展从网络中获取命名实体的候选翻译。采用音译特征和共现特征对候选翻译进行排序，输出排序结果。实验中命名实体的翻译方法取得了如下效果：Top 1 包含率79.2％，Top 5 包含率85.0％。

关键词：音译命名实体翻译加权频率加权编辑距离

作者: 赵明明洪宇姚建民朱巧明

作者单位: 苏州大学计算机科学与技术学院,苏州 215006

会议类型: 国内会议

会议名称: 第六届全国信息检索学术会议

会议地点: 黑龙江镜泊湖

会议语种:中文

页码: 357-366

在线出版日期: 2010-08-12（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于音译和网络的命名实体翻译方法研究