面向机器翻译的中文机构地址切分方法
面向企业信息的机器翻译研究一直面临着特定领域标准语料不足,通用训练语料难以满足要求的尴尬局面。在专业训练语料不足的情况下,通过深入研究中文机构地址的构成特点,建立了用于机构地址切分的专用知识库,采用两级匹配模型进行切分,并以地址单元为单位将分词结果提交给基于规则的翻译系统,很好地保证了翻译单元的完整性。实验表明,针对中文机构地址翻译这个特定领域,提出的方法取得了比较令人满意的结果。
中文机构地址 专用知识库 两级匹配模型 中文自动分词 机器翻译
苗文彦 赵铁军 周向根 陈庆轩 王欣欣
哈尔滨工业大学教育部-微软语言语音重点实验室 哈尔滨 150001
国内会议
成都
中文
501-504
2009-05-15(万方平台首次上网日期,不代表论文的发表时间)