会议专题

基于问题与答案共同表示学习的半监督问题分类方法

问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务.本文提出了一种基于问题和答案共同表示学习的问题分类方法.该方法的特色在于,利用问题及其答案作为共同的上下文环境,学习词的分布式表示,从而充分利用未标注样本中问题和答案隐含的分类信息.具体而言,首先,我们引入神经网络语言模型,利用问题与答案共同学习词向量表示,增加问题词向量的信息量;其次,加入大量未标注的问题与答案样本参与词向量学习,进一步增强问题词向量表示能力;最后,将已标注的问题样本以词向量形式表示作为训练样本,采用卷积神经网络建立问题分类模型.实验结果表明,本文提出的基于半监督问题分类方法能够充分利用词向量表示和大量未标注样本来提升性能,明显优于其他基准半监督分类方法.

自然语言处理 问题分类 共同表示 半监督

张栋 李寿山 王晶晶

苏州大学计算机科学与技术学院,江苏苏州215006

国内会议

第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)

烟台

中文

1-9

2016-10-14(万方平台首次上网日期,不代表论文的发表时间)