会议专题

基于最大熵模型的中文阅读理解技术研究

本文基于山两大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个特征,并使用最大熵模型对中文阅读理解问题回答进行了建模。考虑到语料库规模较小,以1:1的比例从CRCC语料库中随机选取了5组训练/测试集。在5组测试集匕的平均HumSent准确率达到75.46%。

汉字处理 阅读理解 最大熵模型 数理语言学

李济洪 王凯华 王瑞波

山西大学语义网研究室,山西 太原 030006

国内会议

第四届全国学生计算语言学研讨会(SWCL-2008)

太原

中文

159-165

2008-07-23(万方平台首次上网日期,不代表论文的发表时间)