会议专题

基于最大熵模型的中文阅读理解问答系统技术研究

阅读理解系统是自动分析给定的一篇自然语言文章,并且根据文中的信息为每个针对本篇文章的问题生成一个答案的系统。目前英语阅读理解问题回答的研究已有很多,但对中文阅读理解问题回答技术的研究还很少.本文基于山西大学自主开发的中文阅读理解语料库CROC,根据问句和候选答案句的对应关系,抽取10个特征,采用最大熵模型对中文阅读理解问题回答进行建模。实验结果表明,在CROC测试集上的HumSent准确率达到61.5%。

阅读理解 问题回答 最大熵 阅读语料库

王凯华 李济洪 张国华 王瑞波

山西大学 数学科学学院,山西太原 030006 山西大学 计算中心,山西太原 030006 山西大学 计算机与信息技术学院,山西太原 030006

国内会议

第九届全国计算语言学学术会议

大连

中文

643-648

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)