会议专题

基于组合的短语规则抽取方法

本文提出了一种基于组合的短语规则抽取方法。该方法受到句法规则抽取方法(Gallev等,2006)的启发。该方法与已往方法的不同之处在于,目前最普遍使用的短语规则抽取方法将抽取所有与平行句对词对齐信息保持一致的规则。本文提出的方法则首先定义最小短语规则集,然后从最小短语规则集中组合出一个更加紧凑的、包含更多上下文信息的短语规则集。实验结果表明,与目前普遍使用的短语规则抽取方法相比,在保证翻译性能不降低的情况下,本文的方法抽取的短语规则集的规模比基准短语集减小56.6%。在进行短语规则组合时,同时考虑翻译性能与短语规则大小的情况下,组合两次的短语规则己基本达到最优。

李强 高永白 肖桐 张浩 朱靖波

十东北大学自然语言处理实验室 朝鲜平壤计算机技术大学

国内会议

第六届全国青年计算语言学会议

上海

中文

250-256

2012-11-17(万方平台首次上网日期,不代表论文的发表时间)