基于信息熵的改进TFIDF特征选择算法
文本特征的选择对文本分类的精确性有着非常重要的影响、本文针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足, 对TFIDF特征选择算法进行了深入的分析, 并结合信息熵的概念提出了一种新的TFIDF特征选择算法、实验结果表明, 改进后的算法可以有效地提高文本分类的精确度。
词条信息熵 特征选择 数据挖掘 选择算法 文本分类
周炎涛 唐剑波 王家琴
湖南大学电气与信息工程学院,长沙410082;海军工程大学信息与电气学院,武汉430033 湖南大学电气与信息工程学院,长沙410082
国内会议
湖南张家界
中文
312-315
2007-07-26(万方平台首次上网日期,不代表论文的发表时间)