会议专题

基于组合线索和核心扩展方阵匹配的中日句对齐

本文提出了一种基于组合线索和核心扩展方阵匹配的中日句对齐算法。该方法利用字典、字形、长度和特殊字符相结合的组合线索来计算句子相似度,并利用核心扩展方阵匹配实现中日句对齐。该方法在一定程度上解决了传统的基于长度的方法的错误蔓延问题,而且充分挖掘了中日双语之间潜在的联系,增强了相似度计算的可信度。实验表明,在中日句对齐任务中该方法取得了比较满意的结果。

文字处理 机器翻译 语句匹配 数理语言学

胡海鹏 闫永明 吴宏林 张俐 刘绍明

东北大学自然语言处理实验室 沈阳 110004 日本富士施乐公司 日本 神奈川

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

317-322

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)