会议专题

基于信息熵的改进TFIDF特征选择算法

文本特征的选择对文本分类的精确性有着非常重要的影响、本文针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足, 对TFIDF特征选择算法进行了深入的分析, 并结合信息熵的概念提出了一种新的TFIDF特征选择算法、实验结果表明, 改进后的算法可以有效地提高文本分类的精确度。

词条信息熵 特征选择 数据挖掘 选择算法 文本分类

周炎涛 唐剑波 王家琴

湖南大学电气与信息工程学院,长沙410082;海军工程大学信息与电气学院,武汉430033 湖南大学电气与信息工程学院,长沙410082

国内会议

第26届中国控制会议

湖南张家界

中文

312-315

2007-07-26(万方平台首次上网日期,不代表论文的发表时间)