特定领域问答系统中基于语义检索的非事实型问题研究
面向财税领域非事实型问题,提出基于语义检索的方法来抽取答案。首先使用领域知识库对问题及领域文档进行语义标注,引入语义相似度特征提高法规及案例的检索准确率; 其次使用排序学习算法融合领域文本的多种特征对法规检索结果优化; 最后使用法规特征对案例检索结果进行筛选,并从相似案例中抽取相应答案。在真实数据集上的测试结果表明,该方法在准确率和效率上比基准方法有显著提升。
问答系统 非事实型问题 领域知识库 语义检索 排序学习
仇瑜 程力 Daniyal Alghazzawi
中国科学院新疆理化技术研究所,乌鲁木齐 830011;中国科学院大学,北京 100049;新疆民族语音语言信息处理实验室,乌鲁木齐 830011 阿卜杜勒阿齐兹国王大学计算机和信息技术学院,吉达 21493
国际会议
2018自然语言处理与中文计算国际会议(NLPCC2018)
呼和浩特
中文
1-11
2018-08-26(万方平台首次上网日期,不代表论文的发表时间)