一种基于认知情景框架的文本分类方法
在文本分类领域,常用的特征选择方法(如文档频率)是基于概率统计信息的。本文从一个全新的角度,即基于认知情境的语义框架的角度进行特征选择,这种方法可以较准确地抓住文本类别的特征,对提高分类精度与分类效率起到促进作用。由于基于机器学习的文本分类方法近年来得到了广泛的关注与快速的发展,本文运用最大熵分类器,以“罢餐”类文本为例进行文本分类实验,召回率可达96.8%。
认知情境 语义框架 最大熵 文本分类
李月伦 李湘 常宝宝 袁毓林
北京大学计算语言学研究所,北京,100871 北京大学 中文系,北京,100871 教育部计算语言学重点实验室
国内会议
武汉
中文
379-385
2010-10-11(万方平台首次上网日期,不代表论文的发表时间)