会议专题

基于音译和网络的命名实体翻译方法研究

传统的音译方法采用建立音译模型解决音译命名实体的翻译问题,但是该方法不能解决不符合音译规律或部分符合音译规律的命名实体翻译问题。为此,本文提出一种利用音译结果作为扩展,从网络中挖掘命名实体翻译的方法。具体而言,采用加权频度算法从音译结果中抽取单字作为扩展从网络中获取命名实体的候选翻译。采用音译特征和共现特征对候选翻译进行排序,输出排序结果。实验中命名实体的翻译方法取得了如下效果:Top 1 包含率79.2%,Top 5 包含率85.0%。

音译 命名实体翻译 加权频率 加权编辑距离

赵明明 洪宇 姚建民 朱巧明

苏州大学计算机科学与技术学院,苏州 215006

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

357-366

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)