会议专题

基于知网的中文问题自动分类

问答系统能用准确、简洁的答案同答用户用自然语言提出的问题.问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行.本文提出了一种使用知网作为语义资源选择分类特征,并使用最大熵模型进行分类的新方法.以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征.在知网中选择的首义原能很好的表达问题焦点词的语义信息,从而可作为问题分类的一个主要特征.实验结果表明,该方法能有效提高问题分类的精度,大类和小类的分类精度分别达到了90.75%和79.8%.

问答系统 知网 最大熵模型 分类特征 自动分类 中文问题

孙景广 蔡东风 吕德新 董燕举

沈阳航空工业学院,自然语言处理研究室,辽宁,沈阳,110034

国内会议

第三届学术计算语言学研讨会

沈阳

中文

86-90

2006-08-15(万方平台首次上网日期,不代表论文的发表时间)