会议专题

基于组合方法的组块识别

给出了一种词性扩展与voting法结合的汉语组块识别方法(简称组合方法)。首先比较了特殊隐马尔可尖、SVM、CRF三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料中的特殊符号、并列关系以及较粗的词性进行了词性扩展,并采用了一种基于标点符号分割段的voting方法.实验表明,三个基本模型中CRF识别效果最好,而组合方法能进一步提高组块识别的精确率、召回率、F值。

组块分析 浅层句法分析 中文信息处理 词性扩展 统计学习

罗雪兵 黄德根 周惠巍 李丽双

大连理工大学计算机科学与工程系 大连 116024

国内会议

第九届全国计算语言学学术会议

大连

中文

83-88

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)