会议专题

一种基于N-Best结果组合优选的词语对齐方法

本文提出了一种从句对齐语料中抽取出词语对齐的新颖方法。文章比较了主流的词语对齐方法,分析了IBM模型,发现模型在挑选最佳对齐方面的缺陷。我们对每组对齐取NBest的结果,然后利用有监督的学习方法对NBest结果进行组合优选,取得不错的结果。

汉字处理 词语对齐 词汇优选 数理语言学

朱丹青 常宝宝

北京大学信息科学技术学院,计算语言学研究所,北京 100871

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

296-302

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)