会议专题

基于主动学习的中文问题类别标注研究

在开放领域问题回答研究中,问题分类是首要面对的问题,也是影响问答系统性能的关键。而目前问题分类语料规模都比较小,难以满足实际应用中问题分类的需要。本文根据HOWNET 建立一套问题分类的分类体系,并使用主动学习的方法进行中文问题类别标注。此外,我们还通过特征选择来提高标注性能。实验证明,基于主动学习的标注方法在需要较小人工标注同时取得很好的分类性能,并且在一定程度上还可以明显提高问题分类的正确率。

主动学习 Passive Aggressive算法 特征选择 中文问题分类

缪有栋 邱锡鹏 黄萱菁

复旦大学,上海,200233

国内会议

第六届全国信息检索学术会议

黑龙江镜泊湖

中文

167-174

2010-08-12(万方平台首次上网日期,不代表论文的发表时间)