会议专题

汉语base NP识别:错误驱动的组合分类器方法

本文采用一种新的错误驱动的组合分类器方法来实现汉语base NP(base noun phrase)识别.本文首先对汉语和英语base NP识别技术现状进行了综述和分析,明确了汉语base NP的含义,提出了错误驱动的组合分类器方法,然后,在对比两种不同类型的分类器--基于转化的方法和条件随机场分类结果的基础上,再利用支持向量机学习其中的错误规律,对两种分类器产生的不同结果进行纠错,从而达到提高系统整体性能的效果.在宾州汉语树库转化得到的base NP语料集上进行汉语base NP识别交叉验证的实验,与使用基于转化的方法,条件随机场以及支持向量机的方法相比较,实验结果都有所提高,F值达到了89.72%,相对于文中其他方法,最大提高了2.35%.

错误驱动 汉语识别 组合分类器

徐昉 宗成庆

中科院自动化化研究所模式识别国家重点实验室,北京,100080

国内会议

第三届学术计算语言学研讨会

沈阳

中文

256-260

2006-08-15(万方平台首次上网日期,不代表论文的发表时间)