自动答疑系统文本特征选择及权重计算方案设计
答疑系统是远程教育学习支持服务的重要组成部分,将需要的信息反馈给远程学习者是答疑系统的根本目的。本文以TFIDF (term frequency inverse document frequency) 算法为基础,根据答疑系统的实际需要,加入了基于关键词语的特征选择。它利用了文本的结构信息,运用互信息理论提取出对文本内容起到关键性作用的词语。权重计算综合了词语位置、词语关系、词语长度以及资源库可信度等信息,突出了教学资源的特点以及关键词语的贡献,弥补了TFIDF 算法的缺陷,优化了原有的自动答疑系统。
自动答疑系统 特征选择 权重计算 文本特征 远程教育
马楠 王晓军 李建伟
北京邮电大学网络教育学院,北京100088
国内会议
西安
中文
2007-10-20(万方平台首次上网日期,不代表论文的发表时间)