会议专题

基于CRF模型的组合型歧义消解研究

组合型歧义切分是汉语自动分词的难点之一.为此,利用CRF(条件随机场)模型, 以歧义字段的上下文的词和词性建立特征模板,进行歧义消解研究.以1998年半年<人民日报>为语料,对常用的10个组合歧义字段进行消歧,平均消歧正确率达到96.35%,取得了良好的效果.实验表明,利用该模型能有效提高消歧正确率.

中文自动分词 组合歧义消解 CRF模型 汉语自动分词 条件随机场

丁德鑫 曲维光 徐涛 董宇

南京师范大学,数学与计算机科学学院,江苏,南京,210097 金陵科技学院,龙蟠学院,江苏,南京,211169

国内会议

第三届江苏计算机大会

南京

中文

73-76,94

2008-11-14(万方平台首次上网日期,不代表论文的发表时间)