一种利用语义相似度改进问答摘要的方法
在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务,设计了一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算,提出通过使用卷积神经网络表示句子语义和计算相似性,同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明,所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比,使用卷积神经网络能够更好地描述句子语义,计算问题和句子之间的相似性,有效改善了答案摘要的质量。
问答摘要 语义相似度计算 最大间隔学习 卷积祌经网络
应文豪 肖欣延 李素建 吕雅娟 穂志方
北京大学信息科学技术学院,北京 100871 百度,北京 100085
国际会议
第五届自然语言处理与中文计算会议(NLPCC-ICCPOL2016)
昆明
中文
1-8
2016-12-02(万方平台首次上网日期,不代表论文的发表时间)