LCS算法在英汉翻译模板自动提取中的应用
ATTEBSC算法是一种基本的通过句子对比较学习翻译模板的方法,它要求事先把句子对改写成一种特定的比较格式,但是对如何获得这种比较格式并朱作严格规定.本文提出了一种利用最长共有子序列(LCS)计算这种特定比较格式的方法,并利用归一化LCS距离筛选相似度较高的句子,然后通过ATTEBSC算法进行模板的自动抽取.实验表明,该方法简单、有效,能够学出许多有价值的模板.
翻译模板 机器翻译 LCS 英汉翻译
廖剑 李玉鉴
北京工业大学,计算机学院,多媒体与智能软件北京市重点实验室,北京,100022
国内会议
武汉
中文
1271-1275
2005-09-20(万方平台首次上网日期,不代表论文的发表时间)