会议专题

文本分类中TF-IDF算法的一种改进方法

TF-IDF算法是文本自动分类技术中常用的权重计算算法,但它没有充分考虑到特征值在类间、类内和不完全分类3种信息分布情况,影响了查全率和查对率.针对上述3种情况,提出了改进的TF-IDF算法,通过实验证明,改进的TF-IDF算法的效果明显比传统的TF-IDF算法效果好.

文本分类 权重计算算法 特征值 信息分布

张磊 谢旭升

江西师范大学计算机信息工程学院 南昌 330022

国内会议

中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会

昆明

中文

22-24

2014-11-01(万方平台首次上网日期,不代表论文的发表时间)