多分类器集成的现代汉语副词用法自动识别研究

摘要：

现代汉语副词用法功能和用法繁杂多样，其用法的自动识别对自然语言处理有着重要作用。本文选取了支持向量机、条件随机场和最大熵作为三个单分类器模型，研究了准确率加权、概率加权、最大值投票和基于错误修正的加权四种集成方法在现代汉语副词用法自动识别中的应用。并以已标注的2000年1月人民日报为实验语料对十二个副词用法自动识别进行了测试。从实验结果来看，准确率加权和基于错误修正的加权两种方法宏平均准确率分别达到了86．31％、86．42％，高出最优单分类器1．69％和1．80％，表明多分类器集成的方法对副词用法自动识别有一定的效果。

关键词： adverb automatic recongnition ensemble of classifiers support vectormachines conditional random fields maximum entropy

作者: 张坤丽韩冰宋玉昝红英

作者单位: 郑州大学信息工程学院河南郑州 450001

会议类型: 国内会议

会议名称: 第六届全国青年计算语言学会议

会议地点: 上海

会议语种:中文

页码: 18-25

在线出版日期: 2012-11-17（万方平台首次上网日期，不代表论文的发表时间）

会议专题

多分类器集成的现代汉语副词用法自动识别研究