基于组合方法的组块识别
给出了一种词性扩展与voting法结合的汉语组块识别方法(简称组合方法)。首先比较了特殊隐马尔可尖、SVM、CRF三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料中的特殊符号、并列关系以及较粗的词性进行了词性扩展,并采用了一种基于标点符号分割段的voting方法.实验表明,三个基本模型中CRF识别效果最好,而组合方法能进一步提高组块识别的精确率、召回率、F值。
组块分析 浅层句法分析 中文信息处理 词性扩展 统计学习
罗雪兵 黄德根 周惠巍 李丽双
大连理工大学计算机科学与工程系 大连 116024
国内会议
大连
中文
83-88
2007-08-06(万方平台首次上网日期,不代表论文的发表时间)