会议专题

基于答案辅助的半监督问题分类方法

问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务.本文提出了一种基于答案辅助的半监督问题分类方法.首先,将答案特征结合问题特征一起实现样本表示;然后,利用标签传播方法对已标注问题训练分类器,自动标注未标注问题的类别;最后,将初始标注的问题和自动标注的问题合并作为训练样本,利用最大熵模型对问题的测试文本进行分类.实验结果表明,本文提出的基于答案辅助的半监督分类方法能够充分利用未标注样本提升性能,明显优于其他的基准方法.

问答系统 半监督分类方法 答案辅助 标签传播方法 最大熵模型

张栋 李寿山 周国栋

苏州大学自然语言处理实验室 苏州 215006

国内会议

中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)

广州

中文

1-8

2015-11-13(万方平台首次上网日期,不代表论文的发表时间)