一种基于N-Best结果组合优选的词语对齐方法

本文提出了一种从句对齐语料中抽取出词语对齐的新颖方法。文章比较了主流的词语对齐方法,分析了IBM模型,发现模型在挑选最佳对齐方面的缺陷。我们对每组对齐取NBest的结果,然后利用有监督的学习方法对NBest结果进行组合优选,取得不错的结果。
汉字处理 词语对齐 词汇优选 数理语言学
朱丹青 常宝宝
北京大学信息科学技术学院,计算语言学研究所,北京 100871
国内会议
太原
中文
296-302
2008-07-23(万方平台首次上网日期,不代表论文的发表时间)