汉语base NP识别:错误驱动的组合分类器方法

摘要：

本文采用一种新的错误驱动的组合分类器方法来实现汉语base NP(base noun phrase)识别.本文首先对汉语和英语base NP识别技术现状进行了综述和分析,明确了汉语base NP的含义,提出了错误驱动的组合分类器方法,然后,在对比两种不同类型的分类器--基于转化的方法和条件随机场分类结果的基础上,再利用支持向量机学习其中的错误规律,对两种分类器产生的不同结果进行纠错,从而达到提高系统整体性能的效果.在宾州汉语树库转化得到的base NP语料集上进行汉语base NP识别交叉验证的实验,与使用基于转化的方法,条件随机场以及支持向量机的方法相比较,实验结果都有所提高,F值达到了89.72％,相对于文中其他方法,最大提高了2.35％.

关键词：错误驱动汉语识别组合分类器

作者: 徐昉宗成庆

作者单位: 中科院自动化化研究所模式识别国家重点实验室,北京,100080

会议类型: 国内会议

会议名称: 第三届学术计算语言学研讨会

会议地点: 沈阳

会议语种:中文

页码: 256-260

在线出版日期: 2006-08-15（万方平台首次上网日期，不代表论文的发表时间）

会议专题

汉语base NP识别:错误驱动的组合分类器方法