面向机器翻译的中文机构地址切分方法

(0)

摘要：

面向企业信息的机器翻译研究一直面临着特定领域标准语料不足，通用训练语料难以满足要求的尴尬局面。在专业训练语料不足的情况下，通过深入研究中文机构地址的构成特点，建立了用于机构地址切分的专用知识库，采用两级匹配模型进行切分，并以地址单元为单位将分词结果提交给基于规则的翻译系统，很好地保证了翻译单元的完整性。实验表明，针对中文机构地址翻译这个特定领域，提出的方法取得了比较令人满意的结果。

关键词：中文机构地址专用知识库两级匹配模型中文自动分词机器翻译

作者: 苗文彦赵铁军周向根陈庆轩王欣欣

作者单位: 哈尔滨工业大学教育部-微软语言语音重点实验室哈尔滨 150001

会议类型: 国内会议

会议名称: 2009国际信息技与应用论坛

会议地点: 成都

会议语种:中文

页码: 501-504

在线出版日期: 2009-05-15（万方平台首次上网日期，不代表论文的发表时间）

会议专题

面向机器翻译的中文机构地址切分方法