会议专题

基于条件随机场的冠词选择研究

冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。本文针对传统的基于规则和机器学习的方法只考虑名词短语前冠词选择的问题,将冠词看作一种标记,将该问题形式化的描述为一个序列标注任务,提出一种基于条件随机场的解决策略,选取特征时充分利用词、词性等多层次资源,并引入前后词的互信息。实验采用包含91106个冠词的专利摘要做测试语料,F值达到80%。

汉字处理 冠词选择 条件随机场 数理语言学

宁伟 蔡东风 季铎

沈阳航空工业学院 知识工程中心,辽宁 沈阳 110034

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

111-117

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)