文本分类中TF-IDF算法的一种改进方法
TF-IDF算法是文本自动分类技术中常用的权重计算算法,但它没有充分考虑到特征值在类间、类内和不完全分类3种信息分布情况,影响了查全率和查对率.针对上述3种情况,提出了改进的TF-IDF算法,通过实验证明,改进的TF-IDF算法的效果明显比传统的TF-IDF算法效果好.
文本分类 权重计算算法 特征值 信息分布
张磊 谢旭升
江西师范大学计算机信息工程学院 南昌 330022
国内会议
中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会
昆明
中文
22-24
2014-11-01(万方平台首次上网日期,不代表论文的发表时间)