多分类器集成的现代汉语副词用法自动识别研究
现代汉语副词用法功能和用法繁杂多样,其用法的自动识别对自然语言处理有着重要作用。本文选取了支持向量机、条件随机场和最大熵作为三个单分类器模型,研究了准确率加权、概率加权、最大值投票和基于错误修正的加权四种集成方法在现代汉语副词用法自动识别中的应用。并以已标注的2000年1月人民日报为实验语料对十二个副词用法自动识别进行了测试。从实验结果来看,准确率加权和基于错误修正的加权两种方法宏平均准确率分别达到了86.31%、86.42%,高出最优单分类器1.69%和1.80%,表明多分类器集成的方法对副词用法自动识别有一定的效果。
adverb automatic recongnition ensemble of classifiers support vectormachines conditional random fields maximum entropy
张坤丽 韩冰 宋玉 昝红英
郑州大学信息工程学院 河南 郑州 450001
国内会议
上海
中文
18-25
2012-11-17(万方平台首次上网日期,不代表论文的发表时间)