文本分类中一种基于词类间概率分布的特征选择算法
特征选择在文本自动分类中扮演了比较关键的角色,本文在词的类间概率分布基础上,使用分布函数的区分度和相似度,将噪声词的去除和保留词的聚类相结合,提出了一种新的文本特征选择算法,实验结果表明,该算法具有较好的性能效果.
文本分类 特征提取 类间分布 词聚类 区分度 相似度
邢昊 张凌
华南理工大学信息网络工程研究中心(广州)
国内会议
北京
中文
94-98
2003-03-01(万方平台首次上网日期,不代表论文的发表时间)
文本分类 特征提取 类间分布 词聚类 区分度 相似度
邢昊 张凌
华南理工大学信息网络工程研究中心(广州)
国内会议
北京
中文
94-98
2003-03-01(万方平台首次上网日期,不代表论文的发表时间)