会议专题

基于有限资源的双语词对齐算法

双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及不同语言间的固有差异和翻译习惯等诸多问题.本文在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧算法,将词对齐问题转化为迭代求解锚点词对的过程,取得了较好的效果.经过对真实语料的测试,词对齐准确率达93.0﹪,召回率达77.3﹪,F值达84.2﹪,基本上满足了应用的实际要求.

自然语言处理 双语词对齐 语料 锚点词对 双语语料库 机器翻译

张孝飞 陈肇雄 黄河燕 张亮

中国科学院计算机语言信息工程研究中心(北京)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

320-325

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)