基于最大熵模型的中文阅读理解问答系统技术研究

摘要：

阅读理解系统是自动分析给定的一篇自然语言文章,并且根据文中的信息为每个针对本篇文章的问题生成一个答案的系统。目前英语阅读理解问题回答的研究已有很多,但对中文阅读理解问题回答技术的研究还很少.本文基于山西大学自主开发的中文阅读理解语料库CROC,根据问句和候选答案句的对应关系,抽取10个特征,采用最大熵模型对中文阅读理解问题回答进行建模。实验结果表明,在CROC测试集上的HumSent准确率达到61.5％。

关键词：阅读理解问题回答最大熵阅读语料库

作者: 王凯华李济洪张国华王瑞波

作者单位: 山西大学数学科学学院,山西太原 030006 山西大学计算中心,山西太原 030006 山西大学计算机与信息技术学院,山西太原 030006

会议类型: 国内会议

会议名称: 第九届全国计算语言学学术会议

会议地点: 大连

会议语种:中文

页码: 643-648

在线出版日期: 2007-08-06（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于最大熵模型的中文阅读理解问答系统技术研究